大模型混战:谁在抢跑商业化落地?

大力财经 时间:2023-07-21 发表评论
 图片出品| 大力财经

文 | 魏力

ChatGPT上线两百天之后,中国的大模型技术发展开启了“狂飙”模式。
据称,中国已经有79个10亿参数规模以上的大模型发布。在这个激烈的竞争中,各大厂商都在努力赶超对手,否则就会被淘汰。
在人工智能领域,大模型技术的快速发展正在推动着行业应用的深度变革。随着大量新大模型的涌现,各大厂商都在努力赶超对手,以争夺市场份额。在这个激烈的竞争中,如何将大模型技术应用到行业中,实现落地成为了一个重要的话题。
对于AI的意义,国内外公司都没有分歧,都认为会在各个领域产生极大影响,甚至会取代很多人的工作,因此各大科技公司都在研发AI大模型,国内不仅是BAT、字节、京东、华为等巨头入局,高校、研究院及创业公司也在推大模型。
大厂们都在积极推进大模型技术的研究和发展。百度文心大模型已经进化到了3.5版本,阿里通义千问则构建了家族模式,京东言犀大模型则是为自己“量身定做”的产业大模型,科大讯飞发布星火大模型,美团牵手清华系,领投AI公司智谱华章,360智脑将接入“360全家桶”。除了以上公司产品,还有国内大厂开始密集发布类ChatGPT产品。
图片
(图片来源:IT局内人)
大厂大模型技术的竞争非常激烈,今年上半年就有近百家企业宣布要做大模型。这些大厂和AI公司都在拼研发,想要在这个领域取得优势。不过,目前还没有明确的指标或者准则去验证谁家的大模型更优质,这使得评估大模型的技术能力变得困难。
最近,IDC发布了一份报告,提出了AI大模型技术能力评估框架。这个框架包括三个维度:产品技术、服务生态、行业应用。其中,算法模型和行业覆盖是衡量大模型能力最重要的两个指标。只有通过算法模型的突破,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。
大模型的研究也面临诸多挑战。首先,大模型的计算资源需求巨大,需要高性能计算集群和大量的GPU资源。这不仅增加了研究的成本,还使得大模型的部署和应用受到限制。其次,大模型的训练和调试难度较高,需要大量的的人力和技术积累。此外,大模型的部署和应用也需要考虑到实际场景中的各种问题,如数据质量、模型部署的可靠性和安全性等。

不过国产大模型的表现良莠不齐,几乎每家都在明里暗里跟ChatGPT对标,但是从网友的体验反馈来看,能达到GPT-3.5水平的都不多,达到当前GPT-4水平的更是凤毛麟角。

图片
在这个激烈的竞争中,各大厂都在努力提升自己的大模型技术能力。百度的技术布局比较完整,具有“芯片-框架-模型-应用”四层技术栈,阿里云则是在服务能力和生态合作上表现出色,腾讯云和京东云则分别在行业大模型和供应链方面进行深耕。科大讯飞等AI厂家则在垂直赛道上表现出色。
据大力财经观察,大模型已经开始与场景、行业进行深度融合,并在多个领域取得了成功的应用。例如,华为盘古大模型已经在气象、医药研发、电力、语种等领域落地,并交付了多个千亿参数大模型。腾讯云行业大模型能力将应用到金融风控、交互翻译、数智人客服等场景中,提升了智能应用效率,一站式MaaS服务为企业减负。
在金融领域,行业大模型可以加持金融风控解决方案,相比之前有了10倍效率提升,整体反欺诈效果相较于传统模式,提升了20%左右。
大模型的发展不仅停留在科技企业,已经走向各行各业。随着大模型技术的不断进步和应用场景的不断拓展,如何落地及商业化正在成为厂商追求的重点。在这个过程中,各企业和机构逐渐找到了自己的定位,逐渐走向细分方向,最终被更完善的大模型收入麾下。
这需要多年的积累和非常综合的能力,在心态上也必须抱有绝对的长期主义,没有绝对经济实力的玩家,会被甩在半路或者“死”在通往光明的路上。
大模型在应用层面未来想象空间非常大,可以通过新AI技术提效,应用层面的价值一定会分流,依托几个头部大模型会有非常广泛的应用生态。未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发。而行业渗透率和市场份额,将成为企业大模型走向寡头最重要的挑战元素。

- End -


 
反对 0举报 0 收藏 0 打赏 0评论 0
 
网站首页 关于我们 联系方式 使用协议 网站留言RSS订阅违规举报 友情链接