2013年新(xīn)广告法还没实行,旷视科(kē)技為(wèi)Face++写下文(wén)案:“最好的识别云计算平台”。
2014年是“格灵深瞳”的天下,纸媒、门户、科(kē)技媒體(tǐ)争相邀其登上头版。据说徐小(xiǎo)平、冯波和沈南鹏曾就其市值激烈争论,“最后妥协在了3000亿美元这个‘中间数’上”。
2015年,偏居重庆的周曦悄悄创立云从科(kē)技,将目标定為(wèi)“只做人脸,深耕金融和安防”。这一年商(shāng)汤开始经历从學(xué)术到商(shāng)业的激烈转型,还与几家“小(xiǎo)巨头”深度绑定,成立了合资公司。
2016年,旷视拿(ná)到建银國(guó)际和富士康集团的1亿美金融资。一向低调的依图同年将业務(wù)从車(chē)辆、安防,向医疗、城市数据拓展。
如今,云从的初心仍未改变,业務(wù)已渗透到四大國(guó)有(yǒu)银行;依图拿(ná)到3.8亿C融资,商(shāng)汤则破天荒融到4.1亿美元,距上市更进一步。
这是属于中國(guó)CV(计算机视觉)公司的五年,这是属于他(tā)们的时代。
2011-2013,开始时从四方赶来,我们都有(yǒu)光明的前途
2011年8月iOS平台第一款體(tǐ)感游戏《Crow Coming》发布时,市面上最新(xīn)款苹果还是巴掌大的iPhone4。开发这款游戏的团队叫“VisionHacker”,成员只有(yǒu)三个人:印奇、唐文(wén)斌和杨沐。
谁也没想到,正是这款游戏拉开了中國(guó)CV时代的序幕。两个月后,三人正式成立旷视科(kē)技——这大概是中國(guó)最早定位于计算机视觉的创业公司。再过两个月,他(tā)们便会顺利拿(ná)到联想之星的天使投资。
通过摇晃头部赶走乌鸦的《Crow Coming》,正是一份用(yòng)来展示人脸技术的敲门答(dá)卷。据当时的报道称,这款游戏不仅获得清华大學(xué)第三十届“挑战杯”特等奖,还在短期累积4万用(yòng)户,“一度冲到中國(guó)區(qū)App Store排行榜的前五名”。
分(fēn)任CEO、CTO的印奇和唐文(wén)斌是2006届清华姚班同期,大二时又(yòu)共同在微软亚研(MSRA)实习,只不过一个在人脸识别组,一个在图像搜索组。至于担任工程副总裁、曾经的國(guó)际信息學(xué)奥赛金奖得主杨沐,则是两人的學(xué)弟(dì)。
三人早早便制定了旷视的“三步战略”:第一步,搭建Face++人脸识别云服務(wù)平台,目标是识别人脸;第二步,搭建Image++,目标是识别万物(wù);最后,则是实现“所见即所得”的机器之眼。
与之类似,赵勇也早早确定了格灵深瞳的方向。為(wèi)了补上硬件短板而去哥(gē)大CAVE实验室进修、學(xué)成归来的印奇发现,站在计算机视觉风口浪尖的人,已经变成在美國(guó)呆了十几年、顶着Google Glass核心成员光环回國(guó)的赵勇。
赵勇比印奇大上十几岁,是复旦電(diàn)子工程系95级校友。自第一次在CSDN与媒體(tǐ)见面,赵勇就被打上成熟稳重的“工程师”标签。2013年的互联网VC,笃信硅谷,笃信Google,笃信未经商(shāng)业社会洗礼的实验室研究员,能(néng)代表全世界最先进的科(kē)技生产力。
格灵深瞳的目标很(hěn)简单:通过传感器实现三维图像,即通过激光发射器和接收器,以结构光的方式获取空间中物(wù)體(tǐ)的深度信息。基于此,计算机就可(kě)以对图像中人的行為(wèi)进行识别和分(fēn)析。
与此同时,赵勇也在谷歌内部寻找合伙人,先后曾有(yǒu)两名工程师承诺加入,又(yòu)在最后时刻反悔。这年6月,赵勇等来了联合创始人何博飞。这位由徐小(xiǎo)平介绍的合伙人简历相当耀眼,斯坦福商(shāng)學(xué)院、新(xīn)光天地、总裁等关键词点缀其间。所有(yǒu)人都相信这是一次商(shāng)业与技术人才的完美结合,必将迸射出CV界、甚至是科(kē)技界最绚烂的火花(huā)。
站在两者之间的朱珑,说自己选择创业是“一种感觉”。2012年,正在MIT实验室担任博士后研究员的朱珑,在UCLA视觉识别与机器學(xué)习中心主任、导师Alan Yuille教授的支持下毅然回國(guó)。他(tā)拉上自己的童年好友、ACM全球大學(xué)生程序设计竞赛冠军林晨曦,共同创办了依图科(kē)技。
这种感觉叫“计算机视觉离产业化非常近、非常近了”。
2013-2015,共同踏上一条看上去筆(bǐ)直的道路
安防是朱珑定位的第一个产业化场景。
由于需要从海量视频监控数据中精准、快速找到要找的目标,安防领域有(yǒu)大量的视频、图像比对需求,是图像识别、特别是人脸识别技术的天然土壤。同时安防产品亟待智能(néng)化,这个市场既有(yǒu)需求,也有(yǒu)購(gòu)买力。
有(yǒu)技术、没客户,创业之初的朱珑和林晨曦坐(zuò)在办公室里,罗列团队所有(yǒu)人的资源人脉。
与大部分(fēn)白手起家故事类似,最开始总有(yǒu)重重困难,奋力解决后会成為(wèi)撬动未来的支点。当委托朋友的朋友、辗转找到一位公安局副局長(cháng)时,朱珑只得到三分(fēn)钟时间和一句话:“我们现在套牌車(chē)的识别率不到30%,如果能(néng)将识别率提升到70%,就考虑用(yòng)。”
每天上街(jiē)拍車(chē)辆、见警察、了解业務(wù)流程。两个月后接受测试时,系统的号牌识别率和車(chē)辆品牌识别率都达到90%。这套系统的秘密是“車(chē)脸”——同时识别“車(chē)牌”和“車(chē)脸”,更容易发现套牌車(chē)辆。
甫一上線(xiàn),正赶上一起入室抢劫案。通过过滤車(chē)辆品牌,警方十分(fēn)钟便锁定了驾車(chē)逃离的犯罪嫌疑人。自此,依图便敲开公安系统大门。2015年,这套名為(wèi)蜻蜓眼系统还获得了“公安部科(kē)技进步奖”。
車(chē)辆识别之后,朱珑开始把精力放到人脸识别上。据称某省公安厅曾用(yòng)依图的系统比对常住人口、暂住人口与通缉犯库,当天比中17个通缉犯,抓到3人。后来还传奇般的抓到一名背负3条人命,流亡16年的九华山(shān)住持。
“计算机视觉离产业化非常近了”的感觉,周曦也有(yǒu)。
2006-2010年,在跟随“计算机视觉之父”黄煦涛教授學(xué)习的日子里,周曦拿(ná)了不少图像识别比赛的冠军。“拿(ná)了这么多(duō)冠军我就想,不管是检查零件还是挽救生命,总要做点儿有(yǒu)意义的事儿吧。”恰好中國(guó)科(kē)學(xué)院重庆研究院筹建,院長(cháng)袁家虎三次专程赴美邀请,黄煦涛教授便推出这位得意门生。
2011年,周曦以中國(guó)科(kē)學(xué)院“百人计划”专家身份被引进回國(guó),拉上大學(xué)好友李继伟和温浩,组建了当时中科(kē)院最大的人脸识别研究团队。為(wèi)了拿(ná)到中科(kē)院战略性先导科(kē)技专项,几个人重新(xīn)设计产品、更新(xīn)算法、换感光设备,在新(xīn)疆和重庆之间来回奔波了好几个月。最终周曦小(xiǎo)组击败其他(tā)团队,其人脸识别系统也被应用(yòng)到新(xīn)疆安防项目中。
四年之后,意识到“一定要有(yǒu)个公司、有(yǒu)能(néng)力做商(shāng)務(wù)推广让更多(duō)人使用(yòng)这项技术”的周曦,正式成立了云从科(kē)技。他(tā)反复强调专注的重要性,并明确了云从的目标:“一是研究内容要集中,虽然什么都能(néng)做,但现在还是做好人脸;第二是行业上要集中,各行各业都能(néng)做,我们只做金融和安防。”
在2014-2015年间针对格灵深瞳的采访中,时任CEO的何博飞也屡次提到“安防是比手机更大的一块市场”。对硬件和深度信息的执着,使得格灵深瞳天然适合安防场景,“拿(ná)到了天安门广场的全部订单,其它广场还是得一个一个谈”。
事实上安防是一条看上去筆(bǐ)直,却无比曲折的道路。
2015-2016,从學(xué)术空间,到商(shāng)业世界
原因很(hěn)简单,人脸识别对场境要求非常强。产品能(néng)否达到使用(yòng)要求,核心并不在于算法本身,而是对场景的深耕。
2014年,旷视曾拿(ná)下过FDDB评测(人脸检测)、300-W评测(人脸关键点定位)和LFW评测(人脸识别)冠军;同年7月,商(shāng)汤则以三种人脸识别算法占据了LFW测评前三名。随后,排行榜上“识别率”的最高数值一度被推高到99.65%。
这诚然是算法水平的有(yǒu)力证明,但也仅仅是停留在训练集与测试集之间,存在于实验室的“理(lǐ)论数值”。
LFW测试的图片数据多(duō)来自网络,现实生活中人脸的获取过程有(yǒu)大量不可(kě)控因素。光的方向、强度,是否有(yǒu)胡须、发型的变化,是否有(yǒu)表情都会影响识别效果。多(duō)种因素叠加后,真实环境下测得的准确率可(kě)能(néng)只有(yǒu)75%左右,甚至更低。
场景自身同样包含着不同需求。如“证照对比”,二代身份证照片分(fēn)辨率较低,或者拍摄时间跨度较大,都会影响识别效果。嫌疑人排查、有(yǒu)配合的一比一识别、无配合的一比一识别,都有(yǒu)不同的场景特点。
这就需要针对场景的不同特点收集大量场景数据,不断调试参数、组合算法、方法,甚至使用(yòng)外围硬件辅助以提升效果,不断迭代以实现产品化。除此之外,还要在工程上满足计算量、延迟、可(kě)维护性等需求。
还有(yǒu)价格。2010年时便有(yǒu)四十多(duō)家安防企业集體(tǐ)上市,2014年的安防市场正在经历大规模洗牌,龙头企业已经在使用(yòng)下压价格的方式打压中小(xiǎo)公司。在满足需求、找到应对方法的同时降低成本,抵抗市场对渠道、品牌的依赖,绝不是刚刚踏入安防领域的 CV 公司就能(néng)解决的问题。學(xué)术背景深厚的各位掌舵人顿时发现,与实验室里的算法参数相比,现实世界既复杂又(yòu)不可(kě)控。
在2015年9月的一次采访中,赵勇承认安防这类软硬结合的产品复杂度超出预计,“我们低估了这种产品在品控上的难度……对于未来,我们觉得更大的挑战是在商(shāng)业上,如何在商(shāng)務(wù)上发挥更大的价值”。打从一开始就定位在安防的格灵深瞳,选择的解决方案是从某上市安防公司挖来一名VP,负责销售和商(shāng)務(wù)。
商(shāng)汤的选择,是与安防老牌捆绑成立合资公司。这家由香港中文(wén)大學(xué)多(duō)媒體(tǐ)实验室带头人汤晓鸥与得意门生徐立成立的公司,是汤教授前半生學(xué)术积累面向商(shāng)业世界的一次野心实践。
2015年7月,商(shāng)汤与东方网力共同成立“深网视界”:商(shāng)汤以其人群智能(néng)分(fēn)析、人體(tǐ)Re-ID(检索)两项自有(yǒu)技术作价出资,持股49%;东方网力出资5000万,持股51%。该公司主要发展智能(néng)安防产品业務(wù),致力成為(wèi)“拥有(yǒu)计算机视觉和深度學(xué)习原创技术的领先安防产品提供商(shāng)”。次年4月,商(shāng)汤还并購(gòu)安防黑马“新(xīn)舟锐视”,以弥补其抢球联动产品的短板。
与之类似,依图于2016年5月与传统身份识别解决方案商(shāng)神思電(diàn)子成立“深思依图”,由神思電(diàn)子提供终端设备及嵌入式软件,依图提供所需软件,双方各持股49%、51%;云从自正式成立时便绑定了智慧城市解决方案提供商(shāng)、上市公司佳都科(kē)技;旷视则成立子品牌“旷视智安”,专注算法产品化。
2016-2017,金融、医疗、自动驾驶……
明天的风啊,吹向哪儿?
2016年,商(shāng)汤与东方网力共同成立的深网视界营收為(wèi)4393万,安防巨头海康威视则為(wèi)319亿。
诚然这是一块广阔到不容放弃的市场,但仍需要奋力耕耘和一点运气。
与安防类似,金融领域也有(yǒu)大量的人脸需求。ATM机刷脸取款、支付,活體(tǐ)识别,人证合一……其应用(yòng)场景的丰富程度,和以技术手段代替重复人力劳动的迫切需求,使得CV公司早早就在该领域布局。
2015年3月,在德國(guó)汉诺威消费電(diàn)子、信息及通信博览会(CeBIT)上,马云对着手机摄像头微微一笑,买下一枚1948年的汉诺威纪念邮票。这次面向世界的人脸支付场景展示,既宣告着人脸识别技术开始走向商(shāng)业场景,同时是旷视一次面向世界的技术展示:作為(wèi)合作伙伴,其人脸支付认证技术已得到蚂蚁金服认可(kě)。
商(shāng)汤也不甘示弱。2015年10月借贷宝上線(xiàn)不久,商(shāng)汤便与其达成深度合作,注册、大额转账、出借等环节会大几率触发人脸识别环节。二者不仅成立合资公司人商(shāng)鼎诚,随后该公司又(yòu)入股商(shāng)汤子公司今始科(kē)技——更為(wèi)人知的名字是“LinkFace”。借贷宝疯狂膨胀的超亿规模的用(yòng)户,成就了当时世界最广泛的人脸识别技术应用(yòng)。
云从的目光一直紧盯着银行。工商(shāng)银行、农业银行、建设银行、中國(guó)银行均使用(yòng)其提供的人脸识别软件,应用(yòng)于柜台、直销银行、手机银行、网银等场景。大型银行之外,西安银行、重庆银行、贵阳银行,海南银行等中小(xiǎo)银行,广電(diàn)运通、信雅达等大型银行系统供应商(shāng)同样选择云从作為(wèi)人脸识别供应商(shāng)。
依图也做了自己的尝试,通过与招商(shāng)银行VTM(Virtual Teller Machine,遠(yuǎn)程视频柜员机)合作,已经在106各城市近千台ATM机上实现“刷脸取现”。
与安防类似,金融也有(yǒu)传统行业的一面,同样需要时间和运气。到底该将精力放到哪儿,CV公司各有(yǒu)自己的想法。
曾经為(wèi)媒體(tǐ)追捧、如今深陷泥沼的格灵深瞳,赌对了自动驾驶。经赵勇劝说投身自动驾驶的吴甘沙,在2015年底与其共同成立驭势科(kē)技。2016年4月,格灵深瞳作為(wèi)投资方入股驭势科(kē)技,两者成為(wèi)“兄弟(dì)公司”。
今年3月,驭势在广州白云机场完成无人驾驶场地車(chē)试运营,明年下半年将展开小(xiǎo)批量试产。据称何博飞出走后,由赵勇带领的格灵深瞳将延续此做法,很(hěn)快将会有(yǒu)第二家类似方式运作的公司。
依图则自2016年下半年开始发力医疗,其开发的胸部CT影响辅助诊断产品已经在浙江深人民(mín)医院、复旦大學(xué)附属肿瘤医院等数十家三甲医院部署,报告采纳率超过90%。就在今日,依图宣布与浙江省儿童医院结成战略合作伙伴,并发布了一款基于儿童骨龄的智能(néng)辅助诊断系统。
CV之外,依图还在NLP(自然语言处理(lǐ))领域展开尝试,开发了基于海量病例的儿科(kē)辅助诊断系统“咪姆熊”,以及病例智能(néng)搜索发动机。
继去年招募MSRA(微软亚洲研究院)首席研究员孙剑加入后,今年8月旷视引入Adobe首席科(kē)學(xué)家王珏,负责旷视美國(guó)研究院。该研究院与孙剑带领的旷视北京研究院互补,在独立承担部分(fēn)研发工作外,还要开拓新(xīn)市场。在涉足过身份认证平台、智能(néng)园區(qū)、安防硬件MegEye等几乎所有(yǒu)人脸应用(yòng)方向后,旷视也在做智能(néng)服務(wù)机器人等尝试。
7月获得4.1亿美元巨额融资的商(shāng)汤,正在加速实现技术和产品落地,原本以算法、研发為(wèi)重的思路正向商(shāng)務(wù)倾斜。据透露,商(shāng)汤如今有(yǒu)5位销售总监,每位手下10人,共计五十多(duō)名销售。
说是恩仇录,计算机视觉的应用(yòng)蛋糕还未做大,谈什么恩仇?
他(tā)们的时代,才刚刚开始。
据近日红杉、真格联合发布的《全球人工智能(néng)专利资源发展概况》报告中称,中國(guó)在计算机视觉方面的专利已跃居世界第一,占当前全球专利公开数量的55%。
“如果在有(yǒu)生之年能(néng)够看到人工智能(néng)全面影响生活,哪怕下一秒(miǎo)就死掉,我也值了。”
“如果我活到70岁,无论经历多(duō)少失败,我所做的事情一定会改变这个世界。”
虽说CV的现实是抛去形容词后留下的部分(fēn),但这些都是CV公司掌舵者们曾流露过的真实心声。正是这种理(lǐ)想支撑他(tā)们挨过AlphaGo前的AI寒冬,走向下一个CV的五年。
如今还有(yǒu)一个疑问,旷视和商(shāng)汤,到底谁会先上市?
作為(wèi)信息社会通用(yòng)基础设施,时下5G产业建设以及发展如火如荼,并将最终带动数十万亿规模的社会经济发展。但5G在正式进行商(shāng)用(yòng)化普及应用(yòng)前的态势如何发展?5G将為(wèi)哪些领域的变革带来有(yǒu)益赋能(néng)?5G将在各行各业掀起什么样的市场风暴?系列问题依然困扰着各界人士。
為(wèi)进一步深入了解产业发展脉络,理(lǐ)解5G产业现状以及未来趋势,让各界人士更清晰的洞察5G产业发展过程中的机遇点。6月14日,经上海市经济和信息化委员会、上海市商(shāng)務(wù)委员会、上海市長(cháng)宁區(qū)人民(mín)政府指导,由亿欧公司联合承办的“5G物(wù)联峰会”将于上海虹桥世贸展馆举办。
亿欧“5G物(wù)联峰会”将特邀政府、學(xué)界、商(shāng)业、投资机构等领域的专业人士,以多(duō)领域视角切入,深究5G产业发展脉络,探索5G赋能(néng)各行各业的新(xīn)思路、新(xīn)方法,供行业内外各界人士参考。活动详情请戳:https://www.iyiou.com/post/ad/id/824