导读:近两年,号称“AI四小龙”的机器视觉公司商汤、旷视、云从、依图,资本市场表现和裁员等传闻,可能让大众觉得,机器视觉不是一门好生意,这个领域也没什么戏了。
情况显然不是这样的。一方面,计算机视觉(简称CV)仍是人工智能技术应用比重最高的领域之一,相关应用是各行业数字化、智能化的首选,基于机器视觉的工业质检、巡检、物流机器人、人脸识别等都在越来越多地落地,没有道理AI很行、CV不行;另一方面,整个机器视觉市场仍在不断增长,根据福布斯的预测,到2022年底,计算机视觉技术市场的价值预计将达到480亿美元,并可能成为持续创新和突破的源泉
显而易见,不是机器视觉的生意不再性感了,而是头部机器视觉公司讲不好这个故事了。
然而,面对地缘政治的打压、国内房地产基建旅游等的放缓、海内外资本市场的现实情况,这种情况下,再用刻薄话去奚落“AI四小龙”的窘境,多少有点没心没肺。
当然,来自产业用户和开发者们的真实声音,也让我们无法轻佻地说出“风雨过后终会见彩虹”“守得云开,未来可期”之类的鸡汤话。因为现实很可能是,等经济大环境复苏,有的公司还能翻身,而有的可能就此沉沦。
时世变化之时,机器视觉公司又能朝哪里走?是否真的看到了产业AI的变幻?如果要求生,目前有哪些急需开展的工作?这是我们想要探讨的。
机器视觉还是一个好生意吗?
以AI四小龙为代表的机器视觉企业表现不佳,被认为是机器视觉乃至AI商业化的破灭。毕竟这些企业在技术能力、商业模式、市场份额上都有绝对的领先优势,如果连它们都难于盈利,不证明以算法能力见长的AI独角兽确实“德不配位”吗?
让我们离开一些媒体们“报忧不报喜”的习惯,到更广大的产业世界去看一看。
过去几年的时间里,机器视觉作为AI技术最为成熟、应用最为广泛的能力,是在积极被产业拥抱的。手机应用中的身份验证、机场车站的体温监测、安防领域的主动识别、工业领域的智能质检、交通领域的车流车辆识别……可能绝大多数人最先感知到的AI能力都是机器视觉。
以机器视觉作为转型入口,推动行业/企业智能化,在今天几乎是共识。
业内有句吐槽:“AI+工业逃不出机器视觉的窠臼。”这真的是缺点吗?我们采访过许多工业企业,大部分人都提出,自家企业首先落地的就是质检、巡检这里机器视觉应用。来自机科发展的一位技术人员告诉我们:这是现在大部分AI或深度学习落地的现状,以机器视觉落点来推广AI技术,目前还是一个不错的战略。
甚至于在高精尖的航空航天,机器视觉也是一些研究者在尝试深度学习的首选。我们曾和一位航天领域的AI开发者交流过,为什么很多航天AI应用都是图像类的,对方表示教育界同样讨论过这个问题。一来,图像处理领域已经形成了一套比较完整的体系,图像分类、目标检测用得已经很多,可以很快得到不错的效果。二来,深度学习是数据驱动的,航天领域本身就积累了大量的光学图像数据,其他载荷数据也可以引入AI模型,但效果没有CV显著。第三,从航天知识科普的角度来说,图像对于普通人来说是很直观的,火星探测器或者月球探测器每次拍到的图片更能引起公众注意,率先引入CV带来的社会意义更大一点。所以,目前无论是火星车还是其他航天器,都有很多人在与CV技术相结合去解决各种问题。
可以肯定地说,机器视觉是数字基础设施中不可或缺的一个。随着人们工作、娱乐、生活等各领域的图像数据越来越丰富、复杂、剧增,需要分析处理推理的能力也更多,必然会将机器视觉推向一个更大的市场。
或者反向思考一下,如果CV真的不重要、真的没市场,还会成为对岸邻居“封锁”打压的对象吗?
所以,机器视觉一定是值得大力发展和押注的。那么新的问题又来了,以机器视觉起家的“AI 四小龙”营收和商业潜力,都不容乐观,亏损的亏损,破发的破发,裁员的裁员。商汤科技直接在招股书中表示:未来仍有无法盈利的可能。CV公司真的还有前途吗?
有心的读者可能看过一些关于AI四小龙的分析文章,将其业绩不佳的原因归为技术研发投入过高、产业化能力欠佳、科技企业和传统安防企业的围剿等等。这些因素当然是存在的,但要改变却让CV企业左右为难。安防企业转做机器视觉,投入难道就不高吗?降低研发投入,原本的技术优势也没有了怎么办?产业有壁垒,是针对所有纯算法CV企业的,总不能大家都没有办法,集体躺平不干了吧。
既然不能躺平,就要想想怎么咸鱼翻身。那么,来自产业客户和开发者的声音,或许能够带来一些“反常识”的思考。
“反常识”第一点:CV企业研发投入不是过大,而是还不够
“AI四小龙”是公认在技术研发上投入很大的,但随着业绩走低,这被认为是拖累而非护城河。有一个说法是,“我们的首席投资官觉得,商汤能做的,其他公司其实也能做。虽然商汤技术更先进一些,但可能就相差了3个月到半年”。
技术不是壁垒吗?大错特错,技术绝对是巨大甚至最大的壁垒。因为目前阻碍机器视觉在产业中规模化应用的头号疑虑,就是CV技术的实际表现,不达预期。
CV落地产业最常见的问题,大概梳理一下就有不少。
1.替换效果不明显。大家可能会觉得在AI赛事中刷榜就是很厉害的CV了,但需要注意的是,从85分提高到90分,就是学术界的突破了,然而在产业界中,可能要做到95分以上才能够被应用。而且,比赛只是一群深度学习系统关起门来的比武,到了真实世界中,AI对面对的是企业长期使用、已经非常成熟的算法。
郑州大学的马老师,曾受邀为江苏某无纺布企业开发缺陷检测,他告诉我们,工业领域本身就有应用非常成熟的检测算法Halcon,算法经过长期的积累和迭代,已经非常稳定了,而且计算量小,还不用标注数据和调参。相比改造和应用成本,机器视觉需要找到非常有吸引力的差异化应用场景和功能。
2.现实应用性能下降。在实验室中表现很好的算法“优等生”,一落地生产环境就成了“差生”。马老师告诉我们,无纺布是以每小时36公里的速度在往外出布,要求机器视觉算法在高速运动下精准地把缺陷画出位置,技术挑战是非常大的。这时候,传统算法因为计算量小、算法成熟,识别速度反而比CV算法还要快。而且现场环境并不标准、可控,有时候上午光通过玻璃反射,在无纺布上产生光斑,就会影响CV系统的检测精度,误报率很高。马老师及其团队经过了各种调试,才让准确率达到了稳定的数值。对于企业客户来说,更希望引入的是成熟的技术产品,必须CV企业或研发人员做成了,告诉客户确实能提高效益,有的企业才愿意去尝试。
3.应用场景的限制。质检、巡检可能是CV的关键场景,但对于工厂等企业来说,可能只是生产流程的环节之一,所以更多企业在智能化的过程中,可能选择以“打包”解决方案的形式去引入AI,而机器视觉可能只是其中一个点。某科技企业告诉我们,在为一个工厂做产线智能化改造的时候,整个项目额是五千万,其中视觉可能只有五十到一百万。而且偏重工业一点的企业比如冶金、轨道交通、制造等对CV质检的关注度更高,这些领域也是CV企业的红海。
采访者直言,工信部曾经有某副司长带队,带了十家AI企业去到各个公司一家家转,寻找商务合作机会,结果发现,有石化公司提出,想用机器视觉检测代替人工检测,但对方的塔楼很高,让机器人爬楼梯上去巡检,还要保持较高的稳定性,这在当下是不可能完成的任务。最后AI公司们一评估,发现还做不了。类似这种情况还很多,很多企业真正关注的痛点,目前CV技术还无法给到足够大的实质帮助。
大家想必已经发现了,实验室和AI赛事上动辄碾压人类的CV算法,到了现实世界和产业世界中,依然有大的差距。即使是一些渴望AI、适宜CV的重点行业与落地场景,比如质检、巡检,目前仍然存在一些尚未解决的技术难题。
从这个角度来看,CV公司的商业化怎么可能快速进入指数级增长,而头部CV企业也并未能在这些产业客户真正关心的问题上带来眼前一亮的解法。
CV在内的AI技术并没有那么多噱头和风口,成功应用的前提,就是技术本身的成熟度和性价比而已。研发之路,道阻且长,意义深远,也是值得坚持并最终能拉开差距的。
“反常识”的第二点:CV企业营收不好,并不是因为不理解产业
很多人觉得纯算法的AI公司,在做B端市场时,容易因为不了解行业、不了解场景,而导致技术很强、但无法转化。这固然是一部分原因,但不是最根本的原因。
AI与行业深度结合的难度,是众所周知的。AI四小龙基本都有自己深耕的行业及场景,也都在积极地尝试从纯机器视觉转型为更综合的AI解决方案服务商。比如旷视将端侧硬件与AI算法相结合的物联网解决方案;依图重点解决算力问题;商汤的的“1(基础研究)+1(产业结合)+X(行业伙伴)”模式;云从聚焦在金融、出行等核心领域……换句话说,没人比它们更想、也更努力地在了解产业。
更深层的原因或许是,了解了,但没完全了解,也可能永远也无法完全了解。
其一,在认知上,纯算法公司和实体行业有天然的壁垒。
目前工业领域智能制造所提出的“智能”,和AI领域所提出的“智能”,同一个词在概念和应用细节上其实是有区别的,比如AI界倾向于针对某个CV任务、构建模型、学习数据特征,进而让模型具有解决特定问题的能力,也就是纯算法能力。但工业乃至很多行业所想要的“智能”其实是偏实体的,比如生产线的柔性化改造、制造设备的互联互通、以及数字孪生技术等。这种情况下,当CV企业开始进入产业的时候,就会出现“鸡同鸭讲”的现象。
其二,在实践中,纯算法公司的高人力成本不符合大规模定制所需要的经济效益。
企业的数字化转型需求“千人千面”,不仅仅是不同行业和领域,同行业不同公司之间也有着不同的需求,CV应用的场景是非常碎片化的,需要高度个性定制。这就出现了一个矛盾,CV企业要依靠大量人力成本较高的算法工程师来解决所有行业需求,显然是不合实际也成本过高的。
就拿工业来说,工艺、制造需求、专业的不同,都会造成在机器视觉系统所需要的机理模型完全不同,甚至同一领域不同产品间的差异也会很大,复杂度和工艺门槛也比较高。一个工业企业的负责人曾告诉我们,比如冶金钢卷生产的缺陷检测,钢卷又分为冷轧、热轧,这相当于四个问题,虽然都是机器视觉质检,但AI要解决的机理问题是完全不一样的,所以这一个企业、一个场景,都无法做到模型的通用化。而一对一模型的定制开发,又会导致落地成本和实施周期的增加。
脑极体团队曾走访过许多智能化项目,很多细节都是待在实验室里根本想象不出来的。有家猪场希望用AI识别来监测猪的体温,结果系统上线了之后检测效果就是不好,一番排查发现是因为猪皮太厚了,温度识别不准。还有家自来水厂,全部换成了智能摄像头,但平时却基本不开,原因是摄像头拍的高精度视频图像过于庞大,厂里的网络没有同步升级,上传分析的速度很慢。有企业没通知技术人员就直接在生产线上生产其他颜色的布,一下子就给CV系统整不会了……
某AI开发者告诉我们,为一个工厂开发了活塞环检测的AI硬件产品,其中几万个焊点都是他自己手动焊接的,当时的焊接过程还在抖音上直播过,还曾拧过三十万颗螺丝。他说:不会有任何一个软件公司会雇一个算法工程师去拧螺丝,但恰恰因为没有人做这件事情,所以很多做出来的系统会不符合工厂实际的情况,或者工厂会不信服企业提出来的方案。而正因为他会去跟工厂特别直接地交流,做过这些最基础枯燥的手工活,所以提出的AI方案工厂一般都还挺信服的。
公开报道中,“AI四小龙”都表示过研发支出的很大一部分资金就在人才招聘上。一方面,收入规模与人力成本不成正比,营收情况不佳;另一方面,碎片化的智能化需求也决定了企业在努力扩大人力也不可能完全覆盖、规模化复用。
还是用那位AI开发者的话来说:中国可能有上百上千万的加工厂都需要来使用AI,一家工厂可能不同产品需要不同的模型,是不可能来靠一些算法公司的工程师来完成的,可能有大量的一线工人,只要学会用AI,就可以把比较成熟的CV算法应用到生产一线。
换句话说,千行百业的智能化必然需要各种各样的CV应用与模型,当机器视觉技术从通用化、简单化,走向多元化、个性化、场景化,也注定了头部或大型CV企业,不可能凭一己之力训练出所有模型、通吃所有市场。
“反常识”第三点:CV企业看起来被围猎的是市场,其实是同伴
CV企业的商业化不理想,确实受到了传统安防巨头转型AI、以及一些AI科技巨头入局CV的冲击。这些拥有数据、渠道、技术、生态等多方面优势的巨头下场后,似乎一些常见的CV细分市场就开始“卷”价格,以至于像“AI四小龙”这样的机器视觉为主公司很受伤。
但反过来想,CV市场难道是被独角兽垄断的特殊行业吗?
产业智能化必然是由众多AI开发者、ISV服务商和CV企业来共同完成的。而CV企业中可不只有巨头,还有大量中小微企业,对于这些企业来说,来自开放平台的赋能,恰恰是生存和发展的希望。
有视觉领域的创业者告诉我们,自己根本不会以初创公司的名义去跟甲方打交道,那可能连款都要不回来。他们公司是作为某些大型企业的合作供应商,大型企业为客户做整体的系统用集成解决方案,这个CV初创公司解决其中一个小的视觉问题。如果一个小小的企业去单独做项目,可能在项目验收的时候遭遇到各种各样的情况。
“从我们实施的经验来看,现在AI视觉面铺得这么广,在很多问题上没有太好的解决方案的,距离甲方的要求还有一定的距离。举个例子,客户的良品率已经接近100%了,验收阶段要求这条生产线跑一周,一周内的错误率不能超过三次,超过三次就不给你验收。而AI模型,从80%调到95%可能好调,但从95%进到96%、97%就很困难,所以收款是非常困难的一件事情。”
除了商业模式上的难题,中小型CV企业还面临着招人难、建立壁垒难的问题。前面提到,通用性强的CV赛道已经非常拥挤,价格战明显,并且透明度很高,很多企业客户对于AI系统的成本是非常清楚地。“AI四小龙”尚且难受,中小微型企业自然更难以在红海中建立壁垒。
然而另一方面来看,企业客户其实并不在乎技术服务商是用什么技术方法解决问题的,基于深度学习的计算机视觉也可以,传统的机器视觉也可以,只要能够满足应用需求,并且成本可接受。这需要从基础硬件、算法、再到产业层的整体配合,这对于中小型CV企业来说也是一个机会,那就是可集成多元化的软硬件与智能能力,针对买家的需求来进行定制化满足。这时候,科技巨头们的AI开源开放生态、各类机器视觉大模型的推出、算法市场生态等等,让它们成为被选择和被集成的对象,其技术和产品被二次封装成为各种子产品,从而扩展了市场份额。
有ISV服务商表示,在开发解决方案的时候选择了康耐视的相机,这个相机设备自带一个面向工业视觉的算法库,买回去之后可以直接开发出更针对性的产品,部署的时候再买一个品牌的加密狗就可以了,所以完全没有必要和动力再去买一套纯算法公司的算法。
曾几何时,“AI四小龙”这样的算法公司确实通过算法市场化成为了时代的宠儿,但当产业智能化的接力棒被交到更多元的开发者和服务商手中时,相比科技巨头对优秀开发者资源的争夺,大型CV企业确实反应迟缓、优势有限。它们为股价痛苦忧虑的时候,已经有更多个人开发者、小微企业开发者在工厂车间、田间地头开始写代码、拧螺丝了。
正在消失的机器视觉公司
分享了这么多来自开发者和企业的大实话,我们也得给CV企业支支招。首先,机器视觉将在数字经济中占据很重要的份额,这个市场从未停止发展,还有大量场景需要图像处理、图像识别、目标检测等能力,CV可以大展身手的行业是非常多的。但是,未来或许我们会越来越少看到以纯算法作为核心能力的机器视觉公司。
从技术上,CV需要与其他AI技术相结合,才能解决产业关心但尚未解决的复杂问题。
前面提到,产业中还存在大量AI所无法解决的场景,即便是AI应用相对广泛的质检、巡检领域,也有着大量空白的细节场景,这些都是具有产业价值的。但CV无法作为单一技术去实现突破。比如CV与硬件的结合,替代人去一些高塔、雷区、山区进行作业,需要机器视觉、机器人、芯片等方面的综合能力。再比如,“AI四小龙”都在深入的智慧医疗领域,也曾有医生表示,病理图像中包含有很多的图像信息,AI把这些信息提取之后,可以和基因组学、蛋白组学更加深入地进行研究,而不只是目前这样简单的分割或分类。
从商业模式上,对于一些中小微企业来说,通过各大算法平台、开发生态提供的开箱即用的工具/接口,未来将成为融合性的AI解决方案供应商,而不仅仅聚焦于机器视觉能力。对于在CV赛道上具备优势的企业,让机器视觉能力与摄像头、处理器、5G、云等行业所需要的综合技术与能力相融合,支持更多开发者和行业合作伙伴去打造更具行业价值和复杂度更高的模型,商业模式的重构、成功的平台化将拓宽机器视觉产业的深度和宽度。
正在消失的机器视觉公司背后,隐藏着这个转型时代的底色:有人在潮涨潮落中成为过往云烟,有人在深水静流中成为人生赢家。