转载

云莱坞:人工智能写剧本很难,但找剧本能力远远超过人

“手机上看完一百万字剧本,感觉眼睛要瞎了。”这是一位制片人的日常感叹。每天大量翻阅格式不统一、水平参差不齐的剧本,桌上堆满了各种出版的小说,还要在每天都产生上千新作品的网文界“淘宝”,寻找一个好的故事改编,简直难于登天。

但你能想象,如今人们已经可以像阅读新闻一样,轻松浏览海量剧本了么?这就是云莱坞创始人吴又和他的团队正在做的事。

今年年初上线、目前已成为国内最大版权交易与保护平台的云莱坞,被称作“剧本界的今日头条”:数以万计的小说、非虚构作品、剧本和漫画,被整理成故事卡的标准模式,通过智能推送分发给不同需求的制片人用户。同时每天还有上万名写作者,通过平台上传新作品,寻找专业买家进行版权交易和沟通。

云莱坞:人工智能写剧本很难,但找剧本能力远远超过人

云莱坞App新上线4.0版本

云莱坞平台的搭建,离不开公司COO杨宇航带领的技术团队的支持。哈大计算机学院博士、百度前高级技术经理、人工智能学会青工委常务委员,杨宇航的每一个头衔都星光熠熠,而对于从学生时代就开始研究机器学习的他而言,做云莱坞的理由非常单纯,“就是觉得通过人工智能为某个具体行业创造价值,是一件特别有意义的事,”他笑着说。

“云莱坞的技术其实并不仅仅是一款app,而更多是从人工智能、数据挖掘等进行优质内容推荐。”杨宇航认为,如果要做简单类比,云莱坞的运作原理和今日头条有两方面的相似:一是对内容整体质量的把控,二是对用户兴趣和偏好的判断。

从海量内容中把优质内容挑选出来,从而推给用户,这是任何做推荐功能、或者进行内容智能学习的产品都在努力解决的问题。提取关键词是数据挖掘中最常见的技术,但由于和新闻不同,判断不同文学作品之间的差别很困难,这使得作为“专业IP的今日头条”的云莱坞,要达到精准推送需要更复杂的运算。

杨宇航举了一个例子:“对今日头条来说,新闻信息是足够丰富的,基于关键词的判断在其中能起到比较主要的作用。比如文章中有韩国总统、闺蜜,那么这些新闻在说一件事的可能性极大。而云莱坞由于处理的是特殊领域的信息,可能关键词只能起到10-20%的作用。比如同样写了关键词’悬疑’,但一个是密室杀人,另一个是孤岛求生。故事背景、人物设定、场景描述都是千差万别的。”

云莱坞的做法是对作品进行进一步的细分。“比如悬疑题材,系统会自动做出8-10个小类别,可能是从人设,情节发展的角度去做划分,你会发现它们之间的关联性更强。”杨宇航解释,“这些细分类别符合哪些制片人用户的口味,机器会用不同的特质和方式学习出来。”

云莱坞IP库链接了上百万的作品,放在平台的作品已经过万,而这样的数目在作者和版权机构用户的不断上传中还在成倍增加。

云莱坞:人工智能写剧本很难,但找剧本能力远远超过人

10000+实力作家编剧入驻云莱坞

基于内容本身和用户行为,云莱坞的系统不断学习用户的行为,通过其在平台上的浏览痕迹,来了解制片人或者影视公司的偏好。“机器会观察到哪些作品类别是受欢迎的,哪些写作者被制片人看到了,什么样的作品和某些制片人更match。比如宁浩想拍一部黑色喜剧,我们可能就不会把青春类IP推送给他。对于制片人用户来说,使用得越多,推送就会越发精准。”

用户阅读口味的转变,也是推荐系统需要解决的问题之一。“我们会设置一些权重和参数,比如云莱坞推荐10个作品给你,这里面有一部分和兴趣相关,还有一部分是其他类型的优质作品,保持对作品多样性的关注。”

相比于其他平台,需要实名认证的云莱坞存在较高的注册门槛,不过这也确保了平台用户的专业性。目前云莱坞在没有做大规模市场推广的情况下,仅靠行业传播已经积累了3万左右的制片人和写作者用户,每日稳定的用户量也会达到数千人。

云莱坞:人工智能写剧本很难,但找剧本能力远远超过人

云莱坞官方网站

杨宇航告诉记者,基于对平台内容的质量保证,无论来源于签约作者和合作机构,还是作者自行上传的小说或剧本,云莱坞技术和内容团队都会对其进行机器和人工筛选。“我们挑选的优质作品会获得更好的曝光范围和位置,不过对其他作品也并非一棒子打死。”

他介绍,这就好比电影的初始排片率,“卖相”好的作品排的场次多,但其他作品如果经过口碑验证是佳作,同样可以逆袭。“我们要把流量给最有价值的东西。最开始没有专业用户的时候,由我们来做内容的判断,而现在用户多了之后,就是由他们来自主选择了。”

不仅通过数据挖掘和精准推送为制片人用户挑选合适的作品,对于写作者用户,云莱坞也提供最好的使用体验。“从机器的角度,我们不能帮写作者修改作品,但从数据分析的角度,我们可以告诉他们,自己的写作有什么问题。”

制片人用户使用云莱坞时,其阅读行为会被记录下来汇总成大数据。比如一部作品推送给100位用户,有多少制片人点开阅读了这篇作品,有多少人试读了全文,有多少人只看完了一句话梗概。

“我们目前在做的作家后台,就在做这样的反馈数据信息。通过它作者可以看到,哪部作品是更受欢迎的,或者读到某一段时,引发的报价行为很高,可能说明这一段写得特别出彩。”杨宇航表示,“对作者而言,使用云莱坞越频繁,越能积累专业人士对你的判断。”

持续改善对于每一个内容平台来说都十分重要,除了保持用户体验与平台使用流畅程度,云莱坞还计划建立数据中心。杨宇航认为,比起传统影视公司给IP评级评分的体系,通过数据挖掘和机器学习得到的信息更全面和丰富。

“未来云莱坞主要会提供两类数据:一部分是跟作品相关的数据,而另一部分则是指导作品产生的数据,比如当下多数制片人,都在关注或寻找哪类作品。我们还在不断做算法的优化,让无论是已经有很多行为积累的老用户,还是新用户都能更加满意。以上这些都是有一定技术壁垒和技术难度的,也是云莱坞的优势所在。”

云莱坞平台的搭建,离不开杨宇航和他身后这支成熟的技术团队的支持。虽然人数不多,但杨宇航告诉记者,核心技术团队都是BAT出身的资深员工,他随手指着身旁的一位笑着说:“百度文库和百度糯米的后台系统架构,都是由他来完成的”。

这支经验丰富的技术团队,和产品与内容团队密切合作,保证了云莱坞平台平均每月有一次新功能的更新,平均半个月有一次系统优化。从上线至今,云莱坞已经更新了18个版本,从最早用户只能看到内容推荐和出价,到后来开通版权买卖双方即时沟通功能,再到最近更新的版本添加了征稿功能,制片人可以直接在平台征集项目剧本。

除了云莱坞平台,技术团队还搭建了新编剧大赛、版权保护网站等PC端产品。比如版权保护网站,是云莱坞与中国版权保护中心建立合作,云莱坞负责网站管理维护,版保中心负责审核,并将DCI证书经由云莱坞发放给作者。

云莱坞:人工智能写剧本很难,但找剧本能力远远超过人

版权保护网站

“网站上线几个小时,就有上千部作品提交,”杨宇航说,“可能以前在版保中心提交过申请的人,感受会更明显,线上版保是完全免费的,而且周期短,不用跑到省会城市办事机关去排长队。”

据了解,云莱坞平台上线后,IP交易额每季度都以300%的速度在增长,Q3的确认成交额已经超过几千万,从几万的网大剧本到上千万的大IP都有,这还不包括相当一部分的线下沟通交易。

谈到是否担心买卖双方私下交易,杨宇航认为:“通过平台能够帮到写作者或制片人,是我们的基本出发点,所以基本服务包括交易达成是不收一分钱的,用户没有必要绕过平台。如果我是写作者,我一定愿意更多使用平台,因为我这次合作成功了,下一次会在平台上收到更多报价。”

在他看来,云莱坞目前需要做的是把基础服务和功能做好,如果用户有更高的需求,需要特殊团队和额外的运营成本,才会考虑收费。而且收取佣金也并非云莱坞的主要盈利来源,依靠自有深度运营的上千部优质IP,云莱坞已经拥有《大唐悬疑录》、《草样年华》、《真相推理师》等多部作品的影视投资权,未来将与顶级团队携手打造爆款影视作品。

“人工智能目前肯定不能解决普适性的问题,在创造力的方面也很难突破,比如让机器人自己写一个剧本。”杨宇航笑道,“但我们可以解决的是把多数专业人士看好的剧本,推荐给和他们有相似类型喜好的制片人,这是基于他们的浏览行为,比朋友推荐要客观靠谱得多。”

正文到此结束
Loading...