小封机器人是如何写诗的?向中外诗人学习!

封面新闻 2019-03-07 17:17 37392

封面新闻记者 闫雯雯

作为封面新闻编号240号的正式员工,机器人小封是个24小时不间断学习和工作的“超人”。

从2016年12月发出首条稿件至今,小封机器人写稿能力越来越成熟,在青川地震报道就交出了8秒成稿1300字的答卷,引起广泛关注。2018年世界杯期间,小封机器人总共推送世界杯相关资讯600多篇,全网总阅读量超过2亿。在全新的4.0版本中,写作技术全面提升,每月在封面新闻客户端封面号《小封观天下》发稿量达到6000篇以上,涉及体育、财经、等10多个领域。

不仅如此,小封还是一个爱好文学的小家伙。近日,它也有了自己的诗歌专栏——《小封写诗》。那么,小封是如何学会写诗的呢?封面数据研究部负责人徐桢虎解疑:“小封学习了古体诗词曲约20万首,现代诗约30万首。他的老师从中国古代诗人到国外著名诗人拜伦,叶芝等。

从去年4月开始写诗

2016年是人工智能高速发展的一年,各种智能应用在各个领域争相落地。而小封自从2016年12月发出首条稿件至今,一直不断的在学习。2017年,封面新闻推出了“小封机器人”写作,受到了各方的关注。2018年4月,封面新闻AI再度升级,推出了基于自然语言处理、知识图谱技术的写诗应用。

据徐桢虎介绍,小封机器人的诗歌写作能力在过去的一年时间里有了惊人的改变:“一开始,我们是从宋词进行尝试的。因为宋词有更规整的写作规则,通过AI算法根据词牌名、意向、韵律填词,小封一小时能生成几百首各有特色的宋词。后来,在宋词写作的基础上,我们又为小封加入了古体诗写作。古体诗跟宋词比起来,没有明显的规则可循,在解决主题意向、韵律之后,依然会面临含义表达模糊的问题。”

而在全新的4.0版本中,小封不仅可以写出古体诗,而且已经开始向现代诗歌的领域进军。“现代诗跟古文体相比,更抽象,词汇的容量也上升到了一个新的数量级,也需要更大数量级的现代诗数据用于学习,也需要人工进行标注用于小封反复学习,这也是目前我们研究的一个重点方向。”

向古今中外的诗人学习

由于 “小封写诗”本身的功能来源于多个深度学习算法模型共同作用的结果。而数据收集、模型训练可以24小时不间断进行,因此相当于是小封在进行不断的学习的一个过程。

目前小封已经学习了古体诗词曲约20万首,现代诗约30万首。选择训练语料,如诗、词、曲等,不限主题,主要的考量是行文流程、积极正能量的元素。

小封的“老师们”可都是大名鼎鼎的诗人,除了李白、杜甫、辛弃疾、苏东坡这些我们耳熟能详的中国古代诗人,还有徐志摩、顾城和舒婷这些近现代诗人,甚至还有拜伦、叶芝、彭斯、惠特曼……

理论上,对于在计算机上运行的模型而言,它可以生成的诗词组合是无限的。因此小封生成一首诗词的时间可以在一分钟内。

未来将尝试“AI+场景”

那么小封在学习的过程中会像人类学习一样,遇到怎样的困难吗?

“收集来的现代诗样本往往有不小的格式问题,这对数据预处理是一个长期不可避免的困扰。

模型的调优过程中,偶尔也会出现说这次的结果可能并没有上一次的好,因此在尚处于发展过程中的AI技术来说,模型的调优带来了不少的工作量。”这就意味着,小封还有很大的发展空间,未来它的写作能力可能获得更大的提高。

不仅如此,封面新闻的数据团队在未来还会基于小封机器人的算法能力尝试各种文体生成,如:对联、歌词、作文等。当然还有语音生成、人脸识别、视频生成等更多能力,不仅在促进智能技术辅助内容生产、新闻互动形式创新的各个方面,“AI+场景”应用将是探索的一个重要方向。

【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】

评论 7

  • 打野网操 2019-03-07

    机器人创造艺术又不会欣赏艺术.

  • 诤友 2019-03-07

    哈哈哈哈牛了!

  • 胯下狙击手 2019-03-07

    还是有点意思

我要评论

猜你喜欢

去APP中参与热议吧