封面新闻记者 孟梅 张越熙
近日,Sora最初始生成视频上线以后第一时间引发了各界的关注,被称作人工智能领域继ChatGPT横空出世之后的另一个“wow”时点。与此同时,知名AI公司竹间智能被传宣布停工半年,更是引发了大众对于科技商业化领域新旧更替速度的感叹。
2月22日,封面新闻记者专访上海财经大学电子商务研究所执行所长崔丽丽。她表示,对于目前Sora的看法,任何结论性的趋势判断在一项创新刚刚出现的时候可能都为时过早。
“虽然从一些公布的Sora生成结果来看,几乎乱真,甚至好过大多数缺乏专业能力的内容生产者,但其要真正取代或者主导内容创作还需要时间,甚至是不短的时间。”崔丽丽分析,Sora主导或者取代内容创作,至少取决于来自模型和用户两侧的因素。
上海财经大学电子商务研究所执行所长崔丽丽
在模型这一侧,起到决定性作用的有两方面:一是人类世界现有的内容积累以及人工智能大模型学习的速度,二是在纯粹的内容背后一些隐含关联如何进一步被人工智能大模型洞悉和掌握。她谈到,从Sora目前的情况来看,已经能够实现这其中的第一点,就是快速根据已有精标注的视频内容通过学习,对简单标注和无标注的内容进行标注并学习。但是第二点目前在Sora还没看到,即在展现完美视觉生成画面的同时,是否涵盖蕴含于画面其中的力学关系、时空因果关系、局部与整体关系等,这会决定生成视觉画面的合理性和真实感。这很难凭借单一维度的视觉画面内容逻辑关系去甄别。
“这可能意味着,大语言模型在标注视觉画面内容的时候,不仅要用语言描述和形容画面的状况,可能同时需要标注画面中所体现的隐含物理学关系,但语言描述不如数学公式精准是个问题。”崔丽丽解释,也就是说,构成现实世界画面中的合理性的这些数学、物理学原理不是现存大语言模型的擅长,可能需要辅助以其他更擅长数学或物理学原理的技术模型。这显然仍旧需要时间去突破。
在她看来,即使这些问题解决了,Sora仍需要面对从完美的实验室产品到大规模工业化应用之间的鸿沟。崔丽丽从合适的应用场景以及用户侧两点进行分析。首先,运用好的人工智能大模型也需要技巧,要成为魔法师首先要学习使用咒语。这方面的门槛高低决定了一项新技术应用扩散的速度。她举例,ChatGPT出现之后,随之出现的提示词工程师这样一个专业职位/工种。有人说每一种人工智能大模型的出现最先肥了卖课的。各种培训班的应运而生也足以说明,一项新技术的全面替代需要全行业做足时间准备,个人技能的准备往往是第一步。
进一步从商业角度看,新技术早期虽然能够带来竞争优势,但也需要一些投入。崔丽丽指出,这些投入不仅仅包括资金上的,也要计入由此而产生的人员裁撤、组织调整等隐含的管理成本。以上种种说明,那个带领大众打开未来世界黑洞的奇点远远未完待续。这个等待过程取决于人类已有行业数据的积累、模型完善程度、应用场景适配度、学习门槛和资金及管理成本。
“场景需求才是点燃科技生产力的魔法棒。”崔丽丽提出观点,从优化方向来看,一方面对于已有行业的数据积累、数据质量、标注深度有待持续加力的,这取决于场景行业的数字化程度,因此持续推动各行各业加速信息化进程,实现数字化转型是必由之路。另一方面是对于人工智能大模型本身,融入更多能够隐含反映真实世界全局关系的模型表征是重点改进的方向。
“我们在信息技术领域见证了太多新技术普及速度的加速。比如,电商领域就见证了:从搜索型平台到社交传播再到内容分发这种越来越快速汇集流量的模式更迭。事实证明,学习门槛越低,一项技术的普及和全面替代就更快速。因而,降低人工智能模型的使用门槛,和每个人学会与人工智能模型协作共事,是一个相向而行、双向奔赴的过程,可以促进奇点更快来临。这需要技术人员和教育行业中长期的共同努力。”她畅想,奇点之后,人工智能的涌现或许能创造新的文明。人工智能、元宇宙技术的交叉、融合或许真能创造一个“平行世界”。
评论 0
还没有添加任何评论,快去APP中抢沙发吧!