关键词·半年报 | 走过“冰与火”的半年 AI大模型“追光的日子”还能持续多久?|封面天天见

封面新闻记者欧阳宏宇

火了近半年的AI大模型，分野逐渐多了起来。

7月19日，阅文集团在成都发布网文行业大模型“阅文妙笔”。据介绍，该大模型旨在为网文作者解决世界观设定、角色设定、情景描写等，创作中重复性、消耗性的“体力活”。就在两天前，携程也发布了旅游行业垂直大模型“携程问道”；加上天眼查推出的商查大模型“天眼妹”，云鼎科技联合华为云研发的能源行业商用AI大模型“盘古矿山”，聚焦于健康、金融、电商领域的京东言犀大模型，中国移动上线的“九天”系列海算政务、客服大模型……仅仅在7月，头部企业就拿出了近10款行业大模型产品，为“百模大赛”后半程定上了牵手产业场景的基调。

数据显示，目前我国参数规模在10亿以上的大模型数已达79个，自然语言处理、多模态为重点落地领域；后者也是推动各垂直行业智能化升级的基础设施。

但在大厂携AI大模型落地行业场景背后，二级市场相关板块的热度也在骤然降温。最近一个月，A股ChatGPT概念指数已较6月下旬的高点回落15.15%。一边是仍在狂飙突进的AIGC，一边是逐渐回归理性的市场，AI大模型的未来将何去何从？

企业争推行业大模型

唯落地产业场景是瞻

和让AI帮助人类修图片、写周报、订机票类似，协助作家写作的AI大模型，主要也是瞄准了，解决特定场景中枯燥重复性工作的痛点，提高工作效率。

在阅文集团副总裁黄琰看来，针对网文写作研发的行业大模型，可以通过平台积累的创作经验和数据，辅助作者完成世界观设定、角色设定、情景描写和打斗描写。“比如，通过世界观设定功能，帮助作者完成武力值、地图、门派势力等多重细节的完善。”

事实上，聚焦于C端的AI大模型所发挥的作用也越来越具体。例如，“携程问道”大模型就集合了平台上百亿的旅行数据，辅助用户进行旅行目的地、酒店、景点预定与行程规划决策；“天眼妹”致力于为用户提供“可信数据+可信算法”的商查服务，解决通用大模型在商业信息搜索中张冠李戴的痛点；WPS AI则主要用于办公场景中会议纪要、周报、市场文案等内容的撰写。记者粗略统计发现，目前，AI大模型已经进入了办公、制图、视频、旅游、写作、商查、采矿、金融、传媒、政务等10余个行业领域。

事实上，更早之前推出的文心一言、通义千问等也可以解决这些问题，但具体到特定的行业与场景，通用大模型则难以真正理解抓手之所在，因而对工作效率的提升有限。

“通用大模型不会一统天下，用户需要不同的‘机器大脑’。”印象笔记CEO唐毅此前在接受采访时分析到，通用大模型的通用也可以理解为没有个人特色，不会对用户形成的知识、对世界的认知、积累的信息有任何形式的反应。同时，由于通用语料和专用语料不一样，所以用户、企业所积累的独有数据，一定是在专用模型里呈现。

360集团创始人周鸿祎也认为，大模型未来的机会是企业、行业级市场。他尤其提到，公有大模型有很多的不足，首当其冲在于是个“通才”，因而缺乏行业深度。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生则预测，通用大模型可以在100个场景中，解决70%至80%的问题，但未必能100%满足企业某个场景的需求，所以，行业大模型是企业拥抱大模型的更优选项。

从文心一言到“千模大战”

大模型经历“冰与火之歌”

从通用迈向行业，国产AI大模型并非一蹴而就。一路走来，经历了多个发展阶段。

今年3月16日，百度率先推出了大语言模型产品文心一言，涵盖文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多种能力。现场，百度创始人李彦宏预测，多模态是生成式AI一个明确的发展趋势。也就从那一天开始，A股ChatGPT概念指数摆脱了横盘期，在不到三个月的时间里，从不到1300点大涨了超40%。

一个月后，阿里通义千问大模型旋即登场。该AI大模型虽然以通用大模型的形式推出，但在发布会现场，阿里云智能集团CEO张勇对外表示，阿里巴巴所有产品未来都将接入“通义千问”大模型，进行全面改造。自此，中国造大模型从通用开始进入场景应用和落地：华为、京东、科大讯飞、网易、知乎、金山办公、美图、天眼查等大厂推出的AI大模型，都聚焦于其擅长的行业中，比如，网易聚焦于游戏、知乎落脚于问答、美图发力于视觉。

直到国内AI百模大战打了三个多月，腾讯才宣告入局。6月19日，腾讯云对外公布其大模型的研发进展，并明确表示将为合作伙伴提供MaaS一站式服务，助力构建专属大模型及智能应用。这意味着腾讯将是BAT中唯一一个没有通用大模型产品的企业，而只作为技术底座赋能其他企业。此外，文心一言和通义千问也公布了其落地行业场景应用的成绩单。

从通用大模型到行业大模型，再到专属大模型，这背后的逻辑是，企业越来越意识到，AI大模型的价值是解决具体场景的需求，即只要产品够好，用户不会关注技术底座到底是什么。

不过，也正是在腾讯公布大模型研发进展后的第二天，A股ChatGPT概念指数遭遇重挫：连续两个交易日跌去了近15%。在大洋彼岸的ChatGPT也在这期间遇冷。据网络数据平台Similarweb统计，ChatGPT网站在今年6月的访问量环比增速为-9.7%，而在今年1月这个数字还高达131.6%；同时，Civitai、Claude等同类产品也都未能幸免，Civitai的访问量从3月开始不断缩水，平均访问时长仅有14分钟。

仅半年的时间，AI大模型就经历了过山车式的行业，业内人士分析称，在大模型发展初期，企业只顾着和时间赛跑，拼速度，抢流量红利；等到潮水褪去后，企业就要面对应用问题。具体而言，如C端大模型在刚上线时能帮企业积攒人气，但从长期来看，则未必能为企业创造可持续的收入。

例如，上车不久的知乎通过知海图AI、搜索聚合两款AI大模型来丰富问答内容，并已内测了热榜摘要功能，但这些功能内测至今也未能在其站掀起合乎预期的热度。毕竟，AI可以提供正确答案，但无法模拟人类个性化的文风与表达。

商汤智能产业研究院院长田丰认为，按照Gartner此前发布的新兴技术成熟度曲线，每一个新兴技术会经历“技术萌芽期”、“期望膨胀期”、“泡沫破裂低谷期”、“稳步爬升复苏期”四个阶段。AI大模型在“期望膨胀期”时被寄予高度重视，随着“泡沫破裂低谷期”到来，就会面对真正的行业垂直场景进行技术标准化、原型产品优化、服务规模化，形成价值闭环，未来，还会在“稳步爬升复苏期”进一步茁壮成长。

大模型将走向何处？

通用与行业结合将是方向

当AIGC开始“挤泡沫”，是否意味着才火了半年多的大模型快不行了？

“目前看，聚焦行业垂直应用的大模型，能与业务结合，可形成商业模式，有发展潜力，是一条比较好的路径。”北京社科院研究员、南昌理工学院数字经济研究院院长王鹏解读到，从技术发展的逻辑上看，企业纷纷投入大模型训练，只是为了占据制行业高点，这也没有错。

北京社科院研究员、南昌理工学院数字经济研究院院长王鹏

在王鹏看来，行业大模型是企业在加码通用大模型一段时间后，退而求其次的选择。通用大模型虽然应用成本相对较低，但投入成本高，并不适合于所有企业。站在实际操作层面，很多在早期阶段做通用大模型训练的企业，在研发了一段时间后，会遇到模型训练不出来，投入产出不成正比，回报遥遥无期等问题，在这样的情况下，就转向研发自己擅长领域的行业大模型。

和云服务类似，从发展趋势看，“通用+行业+专属”三种不同维度AI大模型产品的结合更符合市场所需。今年5月发布的《中国人工智能大模型地图研究报告》也指出，我国大模型呈现蓬勃发展态势，国内通用类大模型正在持续拓展应用领域，打造跨行业通用化人工智能能力平台，其应用行业正在从办公、生活、娱乐向医疗、工业、教育等行业加速渗透。同时，垂直领域专业类大模型也在不断深化落地，提供针对特定业务场景的高质量专业化解决方案。

“大模型的发展将是行业大模型、通用大模型，和垂直应用相结合。”王鹏也认为，未来的应用格局是，有资源和实力的大企业做通用大模型；有产业资源、行业数据的企业做行业大模型；聚焦中小场景的中小厂商，依托于头部企业研发的AI大模型来做应用。

在这种情况下，今年下半年也将是国产AI大模型的洗牌期。“今年上半年是千模竞发，到下半年，可能就会有一些企业和行业退出。”在王鹏看来，大模型训练的门槛会自然地推动赛道产生的分流，届时，无法形成正向的商业闭环，或者没有应用场景和付费场景的AI大模型将会被淘汰。

在不少分析人士看来，目前已是国产AI大模型的顶峰，未来AI大模型的泡沫将渐渐退去。王鹏也提醒，过去几个月中，大模型和AI结合推动的股价上涨只是短期行为，行业还是应从长线角度去看大模型。

“大模型是久久为功的结果。”王鹏以OpenAI为例谈到，ChatGPT也是训练了三四年，植入了大量的数据才产生的，所以这不是个立竿见影的赛道，需要长期积累。“就下半年来看，行业也不会像上半年一样，只要和大模型题材沾边，就能做高估值，反而市场会越来越理性。”

评论 0

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮