对话实在智能孙林君:从SaaS淘汰赛和AI卡位赛中拿到双赢

新视界作者 产业家 / 砍柴网 / 2024-07-25 22:53
"
一家RPA企业走向Agent的“蜕变”史

作者|思航

出品|产业家

“Adept做的这件事,我感觉你们能做得更好”。

Adept是海外一家成立仅一年时间估值便突破10亿美元的AI Agent(智能体)独角兽公司,甚至在此期间,还获得了英伟达、微软和包括特斯拉自动驾驶负责人Andrej Karpathy在内的行业大佬,以及不少知名风投的站台。这家公司的使命便是,“创建能够像人类一样使用各种电脑软件完成工作的AI智能体”。

接到西湖大学科学家蓝振忠博士这通电话后,早已对Agent有所感知的孙林君发现,这与自己正在做的事不谋而合。

在大数据智能领域有着近20年经验的孙林君,先后任职于摩托罗拉和阿里巴巴的资深算法专家。2018年,就在大模型进入顶峰期的前几年,孙林君离开阿里,创立了实在智能。

彼时他所瞄准的赛道是数字员工,只不过在当时,数字员工还停留在RPA阶段,在孙林君看来,“Agent将会是是数字员工的终极形式”。

RPA做了一年后,孙林君便意识到RPA自身带有局限性,于是在2019年开始尝试RPA+AI融合的方式,即IPA来突破局限性,但这种融合终归还是“做加法”,想要彻底突破局限性,需要重构底层架构。

直到ChatGPT的发布,让这个有着阿里系和谷歌系的创始团队嗅到了属于他们的机会,用孙林君的原话说,“数字员工的终极愿景可能很快就要到来了”。

半年时间,这个有着强AI基因的团队便将行业首款Agent形式的产品发布出来。与此同时,实在智能也进入到关键一年。2023年,是实在智能完成转型的一年,也是国内Agent元年。

从比尔盖茨到李飞飞、吴恩达,无一不表达出对AI Agent的极大兴趣,甚至比尔盖茨还公开发文表示Agent智能体对未来工作的颠覆作用。据统计,过去一年,硅谷至少有100个项目有关Agent商业化,而国内也有700多亿人民币进入到Agent赛道。

而对于踩中风口的实在智能而言,Agent是他们终于等到的机会,也是实现自我突破的关键分水岭。

一、蜕变:看见数字员工的终极愿景

自大模型出现以后,一个最常听到的说法便是,大模型引领新的工业革命,甚至夸张一点,还有的把大模型比做蒸汽机。在科技圈内,一度出现两派观点,一方认为大模型早晚会取代人类工作;另一方认为大模型只能代替人类完成简单、重复性工作。

但如果严谨地说,大模型本身无法代替任何人类工作。由于其本身并不存在于真实世界中,因此大模型无异于“缸中之脑”,即它的逻辑链不能触及物理世界,永远无法与现实产生连接。

真正能代替人类工作的,并非大模型本身;而是让大模型长出“手和脚”的智能体Agent。

一个在财务场景真实发生的例子是,企业下载资金流水,需要登录到银行,选中对应时期,查询再进行下载。其实这样一套简单、重复性的操作完全可以用机器完成。

在过去,它依靠机器人半自动化的方式,但在这背后软件交付工程师需要将这一套流程的代码打出来,或者企业内部用拖拉拽的方式在独立的机器人上才能够完成;而如今在智能体上,一句自然语言口令便可以轻松搞定。

这种演进,也正是实在智能从过去RPA走向如今Agent的发展路线。

RPA做了一年后,孙林君发现RPA本身存在很强的局限性。局限之一在于有些工作纯通过RPA完不成,比如文字识别,这其中就涉及到通过自然语言处理来提取摘要或找关键词;再比如,在控制能力上,RPA的底层操作系统已经很难满足复杂环境要求,对此,实在智能的做法是将AI和计算机视觉(CV)融合进来。

自此,实在智能也正式从RPA阶段跨越至RPA+AI,即IPA阶段。在孙林君看来,“推出IPA的同时,也意味着实在智能从跟随走向引领”。

具体来看,从2022年末,实在智能发布智能屏幕语义理解技术ISSUT;到2023年中旬,发布自研垂直“塔斯(TARS)大语言模型”;紧接着,国内首个基于大模型的Agent智能体产品“实在Agent——你说PC做”在实在智能诞生。2023年末,实在智能获近2亿元C轮融资,与此同时,也标志着Agent的商业化。

从上述一系列产品发布的节点可以看出,从ISSUT到TARS,再到Agent发布,实际上,实在智能在过去一年时间里已然完成了对Agent底层架构的颠覆。“从RPA过渡到Agent,底层架构的确发生了深刻的变化”,孙林君告诉产业家。

对此,实在智能还做了一个形象生动的比喻,在Agent智能体当中,TARS大模型就相当于“脑”,而ISSUT则相当于“眼”,IPA则是“手和脚”。

而在问到“为什么选择自研大模型”的时候,孙林君给出的答案是,“因为市面上的模型无法满足实在智能的需求”。从RPA本身性质出发,它需要与各种软件进行打通,比如实在智能目前已经与市面上1000多款常见软件进行打通。

而对此,实在智能并非选择用API接口的方式,而是通过ISSUT这个“眼睛”的作用,可以自动识别任何软件的UI界面,再利用大模型的自主学习来完成一系列操作。

在这过程中,它所需要的是,底层的大模型要具备多模态能力。然而,在2023年8月,Agent发布之际,国内还并没有任何一家大模型有类似能力。

可以说,从底层架构的重塑,到自研大模型,种种信号仿佛都在表明,实在智能对AI有着极强的“掌控力”。一份成绩单同样也是最好的证明——过去六年时间里,实在智能已获超70项实授发明专利,其中就包括CV、ISSUT等等。

二、跃进:智能体的想象力有多大?

数据飞轮,是被大模型带火的一个词。

要知道大模型的三大要素便是算力、算法和数据。几乎所有大模型企业都非常看重数据资产。

一个最明显的例子便是,OpenAI于2024上半年宣布向用户免费提供GPT-4和4o模型,与此同时,也标注了通过用户对话数据训练模型,用户可以自行选择是否允许。

除了OpenAI,包括火山引擎在内的不少大模型厂商也都在提数据飞轮。而在大模型时代下,数据带给企业的作用就更加明显了。

对于为B端场景提供服务的企业而言,数据飞轮会帮助企业更快地“转起来”。比如在特定的金融、客服等场景下,在数据飞轮的作用下,流程操作会变得更加标准化,从而反哺给Agent企业。

图注:AWS数据飞轮,来源:AWS

“在软件上积累的大量数据都会让任务完成的更丝滑、顺畅。如果把世界想象成一个元宇宙,那么未来连键盘和鼠标都可能消失,就像星际穿越里的塔斯,只需要和他讲话可以完成很多的事情。”

这是孙林君赋予数字员工的终极愿景,而谈到这,它也是实在智能自研大模型TARS(塔斯)的命名由来。

“目前,智能体离这样的畅想还有一段距离。”孙林君坦率地讲到。然而,从星际穿越跳回到现实世界,智能体的想象力还能有多大?

年初,颠覆人机交互模式的AI电脑来了。2024年3月,英特尔的AI PC高调亮相,而AI PC所在的工作正是前文中提到的代替人类工作,对此,比尔盖茨也在公开信中表达了对AI PC小助手的美好畅想。

让AI PC真正照进现实的正是这家从RPA蜕变过来的实在智能。而在英特尔的发布会上,这款AI PC还是面向大量企业客户,尤其是政企客户。

值得一提的是,实在智能在政企客户也有长期积累。在其服务的超2000家客户中,有上百家都是国央企及世界500强企业。

另外,在最近刚落幕的世界人工智能大会上,实在智能还参与了“昇腾原生开发合作签约仪式”,基于华为昇腾开发,从而帮助更好地服务政企客户。

而现如今,实在智能的想象力则从B端走到了C端。

按常理讲,在B端深耕多年贸然转向to C,无论是从产品形态、组织架构,还管理理念和商业模式,思维上都有巨大的差异。然而不同的是,实在智能的使命是数字员工,从现阶段讲就是为员工打造一个“数字分身”。那么,实际上,实在智能的面向人群则是KP(Key Person),本质上依旧是C端。

而从产品的逻辑来讲,B端产品与C端产品最大的不同则在于,后者更注重用户体验。以实在智能为例,很多人不会写代码,需要上网查询。而对于实在智能而言,它能感知到的是大量用户的需求,因此这也很容易演变为商业化产品。

不仅如此,“数字员工”的愿景甚至从国内传到了世界各地。2024年是在实在智能完成Agent转型的关键一年,与此同时,数字员工也正在走向日本、新加坡、东南亚、北美以及欧洲等地。

从星际穿越到服务政企客户,从C端的想象力再到海外客户的认可,可以看到实在智能正在将数字员工的终极远景照进现实。也许,“人人都可以有属于自己的Agent”,就在不远的将来。

三、曙光:如何在SaaS淘汰赛和AI卡位赛中,实现双赢?

从2023年Agent元年,到2024年Agent商业化元年,近两年在这条赛道上发力的有互联网大厂,有大模型公司,有初创企业,也有从其他赛道上转行而来的企业。

似乎对于Agent这件事,大家的理解都各不相同。对于既有算力也有数据的云厂商而言,他们做Agent的思路是基于大模型构建智能体,相当于大模型的“子集”,让他扮演你想要的角色。

第二种则是像用友、金蝶等服务商为企业构建的企业级AI应用平台;第三种则是像钉钉、飞书这种将大模型能力集成在本身的协同办公软件上,而上述这些都可以称之为Agent智能体。

然而,对实在智能而言,Agent智能体的定义还有些不一样。正如前文所说,实在智能的使命在于打造数字员工,因此其所打造的Agent也是针对特定场景的智能体,比如在政务、银行、电商、保险、运营商等等场景,打造更为标准化的智能体。

与过去RPA相同的点在于,都是基于特定场景下的服务,只是用自然语言口令更为便捷;而不同点在于,基于底层架构上的重构,Agent智能体需要企业与客户共同构建RAG,从而保证更个性化地满足客户需求。

实际上,近两年,在Agent这条赛道上,有不少企业之前都是和实在智能并肩作战的RPA企业,比如壹沓科技;再比如从弘玑RPA离职创业的澜码科技,他们都带着些许的Agent基因。

那么,一个问题是,如果Agent是RPA的终极方向,那么这条赛道上,未来又将会呈现怎样的竞争格局?

如果站在Agent这条让AI创业者前仆后继想要涌入的赛道上而言,基于大家对于Agent的不同理解,短期来看未必会呈现出“竞争”关系,而是“强强联手”。

比如年初,实在智能就与同样是作为“AI超级助理”的钉钉达成合作,目前实在智能Agent应用已上架钉钉AI助理市场。

但与此同时,实在智能又不仅仅是新生代Agent企业,它更是从RPA进化而来的企业。

从这一角度来看,实在智能可以说既属于SaaS企业,又属于新时代的AI企业。然而,同样摆在实在智能面前的还有双重竞争,一边是SaaS企业的末位淘汰赛,另一边是AI公司的卡位赛。

有人说,大模型加速了国内数字化的转型,所以对于SaaS企业而言,AI是机会,但同时它也是挑战。

机会在于,用AI将SaaS重构一遍,势必会加速国内数字化转型,也会加速企业的数字化进程,而过去“大家对SaaS付费意愿不强”类似的问题也将不复存在;

但挑战也正在于SaaS企业自身的基因,是在SaaS的基础上加AI,还是用AI用重构一遍,将成为新时代背景下,SaaS企业的“末位淘汰赛”。

那么,AI对SaaS企业究竟意味着什么?在孙林君看来,“如果对于AI有一定掌控力或者有积累的企业,那么这个时代则正是构建护城河的最佳时机。”

与此同时,在AI这个新赛道,还会出现更多的竞争者。可以说,对于国内已经发展了十年的SaaS行业而言,目前已经有不少企业走向IPO,行业know-how的积淀也足够深,如果在此基础上加上AI能力,则足以构建起属于SaaS企业自身的护城河。

从目前的市场格局看,大部分已上市的SaaS企业和SaaS独角兽都已经在做SaaS+AI这件事,只是目前都处于试水阶段,还未有一家有显露出行业壁垒,现在能看到的都是“想象力”。

但对于这个在Agent赛道上屡屡先发制人的实在智能而言,从创始团队的AI基因,到其六年来所积累的行业经验,都在散发着一种独有的强者风范。

分享到
AI
声明:砍柴网尊重行业规范,任何转载稿件皆标注作者和来源;砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为将受到砍柴网的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至:post@ikanchai.com
您想第一时间获取互联网领域的资讯和商业分析,请在微信公众号中搜索"砍柴网"或者"ikanchai",或用微信扫描左边二维码,即可添加关注,从此和砍柴网建立直接联系。

相关推荐

7 月 25 日消息,麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。
7 月 25 日消息,今年 2 月,谷歌宣布与 Reddit 达成一项新协议,Reddit 数据将用于训练谷歌的 AI 模型,并在谷歌搜索结果中着重显示 Reddit 结果。
7 月 25 日消息,微软正不断扩展其面向企业、组织、教育客户和普通消费者的 Copilot 等生成式 AI 服务,因此该公司需要更多数据中心以满足对 AI 服务的算力需求以及网络需求。
7 月 24 日消息,据《华尔街日报》报道,专注于语音助手 Alexa 的亚马逊业务部门在 2017 年至 2021 年期间亏损高达 250 亿美元(IT之家备注:当前约 1821 亿元人民币)。
7 月 25 日消息,微软必应官方博客昨日(7 月 24 日)更新博文,表示已邀请部分必应(Bing)用户,在搜索结果中测试 AI 摘要功能。

热文导读

1
3