AI驱动的边缘应用转型白皮书
访问项目仓库: Github Serverlesslize
前言
AI技术飞速发展,对于AI如何影响生产生活,如何落地,如何影响商业模式等问题无法给出完美答案,白皮书通过参考IT发展史给出了一个特定角度来看待问题,并作出一些判断,未来的项目将会基于这些判断进行开展。
一、背景与时代机遇
随着人工智能(AI)能力的快速跃迁,软件开发与技术创业正在经历一次深刻的范式转移。在传统模式下,技术创业往往依赖完整的工程团队,对前后端开发、运维、部署和基础设施具备较高门槛要求。这一模式在很大程度上限制了非技术背景个体与小团队将创意快速转化为现实价值的可能性。这一局面正在被彻底重构。
在曾经的传统行业转向信息行业中,信息技术(IT)的作用在不同行业和不同场景中的身份不同,这正如当下AI的处境,在不同领域不同场景的看法也不一致。目前的AI已能够承担大量代码生成、调试、重构与文档工作。Serverless边缘计算和AI正在将基础设施成本与复杂度趋近于零;创意、业务洞察、产品定义能力正在取代“纯技术实现”成为核心竞争力;在此背景下,“不懂技术,也能做产品;没有服务器,也能跑应用” 正从理想走向现实。比这更加重要的是,Serverless,AI网关和Token成本压缩技术正在挑起一场全新的数据流转方式。
本文作为先驱战略白皮书之一将会做出从基础理论到路线的战略预测,以指导应用落地。
二,核心判断
2.1 AI转型和IT转型
IT转型指的是在信息技术(特指互联网技术)发展期社会上的传统产业蓬勃的发展转型。例如线下商店的电商化,在线教育,在线音视频通讯等等。他们的形式因为互联网技术的出现被彻底改变。
IT转型无疑改造了社会面目,首当其冲的便是信息效率的提高对于人类本身社交范围的全面重写,这里的社交不仅仅指代生活中的亲友沟通社交,而是人与人之间的大规模无成本沟通成为可能,跨国视频会议,商务线路,云端通信是彻底让分工生产突破时空限制的根本原因。
对于AI未来发展的不确定性而言,核心判断解决的问题是:AI是否是泡沫?AI是否存在算力霸权?AI是否需要AGI才能产生类似于互联网革命的效果?
AI是否是泡沫?AI泡沫常规意义上指的是热钱流入到了远超价值的杠杆上,但不能包含那些无法预估的实际价值上。假设A公司投资一百万到某AI项目上,其中可能90%都是泡沫,但事实上是如果只投10%无法积累量变达成质变;AI的发展能够实际带来很多领域的生产力提升。这个重要事实否认了AI完全由投资泡沫组成,在承认AI有部分泡沫的情况下认可AI发展的价值,即使AI的模型发展有挤牙膏的行为,也不能否认整个行业在AI的技术探索,投资,学习和认知方面的成果。
AI是否存在算力霸权?AI的算力霸权指的是大模型越先进,所需的训练数据和算力就越多,导致只有大型公司才能拥有马太效应的加速机会,一旦出现代差就会导致新玩家无法加入游戏,被头部彻底碾压。从目前的事实来看,AI在朝着平民化,廉价化和通用化发展,而后文的应用场景讨论否认了AI的算力霸权主义,任何人都可以随着AI发展接触到更平民化的AI工具和应用。虽然目前顶尖AI模型和通用模型之间存在代差,但这种代差会逐渐放缓,这个判断是由于天花板效应和应用范围效应得出的。
天花板效应是指,在AI底层技术(如GPU,LLM的底层架构,数学,物理,光速限制)未得到革新的情况下,在应用层的发展探索会逐渐碰到一层看不到的天花板,越接近这个天花板,发展的增量越小,看起来像挤牙膏,顶级模型的领先地位会逐渐被追赶,虽然其他模型永远无法追赶这个差距,但差距本身只会越来越小。
应用范围效应是指,AI的能力受限于应用范围,我们关注的是商业模型本身,或言之,我们关注的是AI能够给我们带来多大价值,而不是AI本身的能力如何,如果某个顶级AI模型能够媲美大师级程序员,那么AI所造成的影响也只是在大师级程序员这个范围,而这个范围本身的人群就不多。除非AI有能力把自己的能力迅速变成价值,否则AI的能力上限对实际创造价值意义有限。
2.2 场景判断
在IT转型中,互联网行业经历了混乱的盲目扩张,泡沫低迷,稳步发展三个大阶段,在盲目扩张阶段,杠杆最大,只要有单一产品有价值,便会迅速抢占蓝海,而在单一产品的增量难以为继时,泡沫被戳破,开始对存量进行优化,同时进行场景改造,从单一产品转向多产品融合,场景分析优化。这种优化方式直接造就了超级应用的诞生,例如一个地图软件最初只有导航功能,后来出现了聊天,购物,广告,甚至短视频和贷款功能,本质上是利用单一产品所创造出的优势进行存量抢夺,这种抢夺可能成功也可能失败,但不可否认的是脱离场景的单一产品确实不再具有优势。
AI当前面临这样的场景问题,AI的最初能力是根据token进行预测输出,Transformer架构的核心能力注定了无法通过模拟神经元的方式进行动态权重调整,参数模型一旦训练完成便只能微调,虽然这样的架构就能够形成如今的AI革命,但应用场景却遇到了曾经互联网产品的问题,即单一化,Chat模型(常见的对话聊天模型)是单一场景的,文生图,文生视频都是单一场景的,但我们已经发现了场景融合带来的巨大收益。AI短视频本质上是Chat模型和文生视频的融合,针对短视频这一特定领域的优化,有趋势能够撬动传统内容行业的根基,多闪APP的爆火更是将传统小游戏,小应用的场景直接呈现给用户。
综上预测,互联网的场景融合之路也必然会应用在AI中。AI网关和AI模型提供商会成为下一代基础设施提供商,而谁能够融合更多的场景解决需求,谁便能继续盘活增量市场。
2.3 入口判断
所谓入口指的是用户在接触AI时的场景入口,例如微信,豆包智能手机都是人们接触AI的入口。入口霸权指的是绝对的用户量和接触面形成的入口垄断,而入口霸权的形成是可预测的,本质上是遵循谁的入口成本更低,谁就会夺得入口主动权。
在互联网时代,入口是PC和浏览器,用户需要输入网址才能进入到互联网应用,后来导航站(例如hao123)成为了新的入口,移动时代,安卓APP,各种移动应用成为了新的入口,但本质上是对互联网应用的迁移,直到微信的出现,微信小程序,快应用直接颠覆了网站-浏览器模式,网站网址变成了小程序名称,在交互模型不变的情况下完成了入口霸权的转移。而AI手机(如豆包智能手机)直接动摇了所有APP的入口霸权,虽然AI手机的合规形式,法律问题尚不明确,但不可否认的是这是下一轮入口霸权,即使在消费品终端受制于法律无法推进,在物理层这种形式也是无法阻挡的。
入口判断的核心有两点:第一点是入口的形式变化,这是温和的,当AI应用成功大规模落地后,入口是可以根据需求变化的,微信作为生活入口,飞书,智能OA作为工作入口是可选的,不绝对的。
入口判断真正重要的第二点,即入口是否是能被预测的?AR/VR眼睛,具身智能机器人,智能家居组成的综合智能体,工业可编程机械或其他形式是否会使上述的入口判断失效?可惜目前的数据显示我们无法针对这点做出任何判断。
三,战略挑战
战略挑战是横亘在AI转型路上的问题,而这些问题既是问题也能作为答案。
3.1 Serverlesslize(s12e)
在IT转型过程中,技术本身也在发展,以软件工程为例,从最初的前后端一体,到前后端分离架构,再到微服务架构,再到如今的SaaS,MaaS,商业需求和技术在同步前进,二者有时快有时慢,但一个重要论断是,商业需求永远是技术发展的驱动力,即先有需求,再有解决需求的技术。一旦为了新的技术从而创造需求,那么非必须的需求会导致资源浪费。从某种角度看,AI技术似乎是新出现的,并且是AI模型创造了市场,但本质上仍然是人类对于重复工作高效完成的需求被AI解决,助推了AI发展,甚至互联网技术本身也是人类对于更快更高效通讯的基本需求催生的产物。
Serverless指的是无服务器技术,利用边缘计算,函数计算等替代掉传统的前后端架构,这是一个随着编程语言的发展而发展出来的新技术,从结果上看,这种技术似乎在创造市场而非解决需求(因为所有的需求似乎都能被其他架构解决)。
这种技术之所以被列为第一项战略挑战,正是因为Serverless尚未成为主流,而我们能够对其“是否会成为主流”进行预先假设,不论这项技术是否会成为主流,针对他的发展路线分析都能够证明上述讨论的正确性。
Serverless技术本身具有一定解决现有需求的能力,对于很多传统应用来说,他们的前后端,微服务实例可以被Docker容器化,而这个过程被称为Dockerlize,对于这些容器化的应用来说,如果能够被边缘计算技术革新或取代,则这个过程就被称为Serverlesslize(边缘化),这是继单体分离转型,分离上云转型,云应用容器转型的另一种全新的转型方式,未来团队会推动这种转型来试图得到答案。
Serverlesslize不仅仅是参考云计算发展的转型,Serverlesslize本身也是AI网关,AI应用融合,快速计算,模型弹性QoS,AR/VR技术的基建技术选型之一。它的蓬勃与否更是取决于大规模网络的部署成本,云计算成本和Network as a Service(NaaS)架构的发展趋势。
3.2 AI世界模型挑战
世界模型指的是物理世界在数字世界的孪生模型,AI世界模型指的是AI理解物理世界的方式。一个简单的例子是,AI需要帮助用户进行购物,其中包含检索,比价,购买行为,这些需要调用手机的屏幕录取,截屏,图像转文字,多模态识别等,而这就是AI理解世界的方式,如果AI只能接受文字输入,文字输出,那么屏幕必须要转为文字,输出结果必须要有执行器帮助完成。
AI世界模型作为第二大战略挑战是因为AI本身具有局限性,而给物理世界建模更是困难。工作流是目前建模的最优方案,因为工作流最大程度上利用了AI的文字识别能力,MCP也将物理世界的复杂度抽象为接口提供给了AI使用,但更加深刻的问题是,AI如何真正的理解世界模型本身。
AI在短时间内只能接受文字,语音,图片或视频这种简单的单一媒体输入,无法真正理解世界,这就对操作AI的工具的建模能力提出了很高要求,因为这种建模能力直接降低了AI的使用成本,一个好的工作流对AI提出的要求是很简单的,AI可以在低负担下完成,无需额外的更高水平的模型能力。但物理世界充满不确定性和复杂性,建模难度非常依赖编写工作流的人,工作流工程师,提示词工程师,MCP工程师的水平才是实现AI能力的核心。
AI世界模型挑战本质上是产品侧和技术侧能否平衡的关键。对于好的产品,即使不需要高级模型,也能满足大量需求,因为所有需求当中只有少部分需要依赖强劲模型(或超级模型),其余大部分任务和需求基础模型甚至简单小模型便能满足。这个挑战是在回答“一个好的产品经理是否能够弥补模型的能力差距”。未来团队会不断判断普通模型的应用落地情况和强劲模型的应用落地情况差异。
3.3 软件胶水挑战
软件胶水挑战指的是在AI落地过程中,软件工程本身更加作为一种胶水工具粘合应用和技术而非核心技术。对于互联网产品来说,游戏产品,通讯产品,电商产品是绝对的纯软件工程产物,他们完全依赖软件工程本身,而非互联网产品,例如传统行业,制造业,商业等产品他们在互联网浪潮中获得了互联网技术的的加速效果,更加便捷,更加高效,但软件本身无法占据绝对核心地位,例如大部分的商业产品仍然强依赖采销部门,采销部门能够信息化,但采销部门本身不是信息化的。
软件胶水挑战是在判断,AI的大部分落地场景会以非核心技术地位,加速非软件工程主导型产品的效率和便捷程度,一方面是AI Agent对于编码能力的优化,越来越多的AI模型厂商推出越来越好的自动编码产品,使得软件行业成本越来越低。另一方面是AI技术与互联网技术的发展路线相似,遇到的问题也相似,而互联网技术作为很多传统产业转型的胶水仍然会碰到“有没有必要转型”,“怎么转型”,“找谁转型”的问题,这些问题往往是复杂的社会学问题,设计企业战略,市场波动,政策支持,互联网企业经历了20多年才基本完成任务,而AI转型也会遇到同样的问题,而从目前AI场景落地的效果来看,AI正在以超过互联网技术数倍的速度实现这一目标。
软件胶水挑战把AI的落地分割成了纯AI驱动和AI加速两种场景,纯AI驱动产品分析较为简单,任何应用AI技术本身的产品都可以直接套用产品经理的方法论,做出好的产品然后主导市场,遵循经典市场发展规律。而AI加速非常依赖产品经理的洞察力,因为场景纷繁复杂,互联网应用个性化程度受制于成本和通用性约束,无法对所有场景进行加速,但AI门槛低,AI工具能够迎来一个人人都是产品经理的时代,只要拥有洞察力和落地可行性,任何一个没有技术背景的人都可以制作一个针对某个场景进行加速的AI应用。未来团队会不断分析AI产品经理和轻资产AI创业者们所遇到的困难和综合解决方案。
四,结语
AI驱动的边缘应用转型是团队的第一个转型项目,我们希望社区给予最大程度的支持,同时也感谢阿里云,腾讯云今年年中对Serverless产品的优化,他们贡献了本文中大部分的实际数据。