手机游戏巴士

2016TFC优数科技温光普:大数据助手游点石成金

发表于:2024-05-01 作者:巴士阿叔
编辑最后更新 2024年05月01日,苹果园 3月18日消息,为期两天的2016第十二届TFC全球移动游戏大会暨智能娱乐展已于昨日在北京国际会议中心正式开幕。今日上午,优数科技副总裁温光普受邀出席大会,在主会场上发表了《大数据助手游点石成金》的主题演讲。他认为,当下互联网的发展使得用户能

  苹果园3月18日消息,为期两天的2016第十二届TFC全球移动游戏大会暨智能娱乐展已于昨日在北京国际会议中心正式开幕。今日上午,优数科技副总裁温光普受邀出席大会,在主会场上发表了《大数据助手游点石成金》的主题演讲。他认为,当下互联网的发展使得用户能够同时拥有多种智能设备,然而如何实现这些设备之间的跨屏互动营销成为其探究的问题。而优数科技在大数据、机器人学习以及效果广告等方面的实力也将助力游戏企业更高效的发展。

  以下为演讲实录:

  优数科技成立于2015年10月,是由中国最大的语音和大数据提供商科大讯飞和中国效果广告第一股壁合科技共同创办的。因为科大讯飞有海量的数据,以及对数据的处理能力,而壁合科技有10年的广告行业从业经验,及对广告效果优化的经验,所以说优数科技是站在两位巨人的肩膀上。

  我们的大数据来自于以下几个方面:

  一:讯飞开放平台。2010年建立,到现在超过5年的时间,有11万以上的合作伙伴,覆盖了13亿手机终端,每天产生的交互次数超过10亿次。语音行业中超过60%的应用使用的都是讯飞的语音能力,这其中就包括手机QQ、微博、滴滴出行、高德导航等大型或超大型APP。这些APP为讯飞开放平台提供了大量的语音数据。

  二:讯飞还有一些自有的APP,比如讯飞输入法,目前用户量仅次于搜狗输入法;另外还有灵犀语音助手、酷音铃声等,这些APP也能为我们提供大量数据。

  三:另外还有来自优数科技和壁合科技的广告投放数据,比如广告素材的曝光、点击、下载等数据。

  有了海量的数据以后,我们首先对数据进行脱敏,去除包含用户隐私的部分,然后对数据进行清洗和分析,得到了DMP人群标签。讯飞DMP目前覆盖了5亿用户,包括25个子分类,1500多个标签。这些标签不光包含性别、年龄、职业、籍贯等人口属性标签,也包含一些上网行为、兴趣爱好、生活方式等人群特征标签。有了这些标签可以进行广告的精准投放。优数科技就是大量使用讯飞的人群标签进行游戏类广告投放的,目前来看效果非常好。

  互联网发展到今天,我们每个人可能拥有很多个智能设备,比如多个手机、Pad或是其他可穿戴设备,甚至是是智能家居的设备,如何跨设备互动营销是目前困扰所有广告公司的难题。为此讯飞创建了一套声纹ID系统,声纹是类似于人的指纹的一种生物特征,对每个人来说都是唯一的,声纹可以唯一标识一个人。这样就可以在不同设备之间进行精准的广告投放。

  前面讲的是优数的数据来源,有了这些数据该怎么用,是我们一直在探索的课题。最近alphago大胜李世石是互联网圈最热门的话题,alphago其实就是一套人工智能系统。类似的系统国内也出现过,比如去年在合肥中考阅卷中使用到的讯飞的阅卷机器人,阅卷内容不光包括客观题,也包括阅读理解、作文等主观题。

  2015年被称为"人工智能之年",2016年将会是人工智能和广告相结合的一年。

  人工智能最核心的是一套机器学习系统。什么叫机器学习,我们来看这个例子,这是现任facebook人工智能实验室主任在一次采访中为了说明机器学习而举的例子, 这是一个最简单的机器学习系统,它的目标是给机器一张图,他能够识别出这张图中是一只狗,还是一辆汽车,这个系统包括三个部分,最左边是输入部分,是一个摄像头,可以通过它来拍摄图片。中间就是核心的机器学习系统,它上面有很多的开关,另外右边是输出系统,如果识别系统认为用来识别的图片是一只狗,那么亮红灯,如果认为是一辆车,那么亮绿灯。有了这个系统我们就可以启动我们的机器学习了,机器学习怎么做的?首先需要我们有训练样本,比如说我现在有10张图,5张是狗,5张是汽车,哪5张是狗,哪5张是汽车,是预先知道的。通过摄像头拍了照片,把已知的训练样本通过摄像头录入,通过中间的机器学习系统进行识别,识别出来以后如果是狗的样本,红灯亮,我们就认为识别正确,如果绿灯亮,就调整机器学习系统上的开关让它变成红灯。开关调节的过程其实就是一个机器学习的过程,通过不停不断的调整和学习,这个识别系统就会越来越准确。如果我们有数千种颜色的灯,有千万级别的训练样本,百万级别的按钮开关,那么这个系统就成为一个深度学习系统。。

  深度学习最常用有三种模型DNN/RNN/CNN,今天主要讲DNN和RNN,因为这两种模型现在的应用是最多的。讯飞最初是把DNN和RNN 用于优化语音识别能力,后来逐渐用于人工智能领域。讲DNN就必须讲到多层感知器,如果机器学习的系统只有一个左边的输入设备和右边的输出设备,这样就是一个单层感知器,解决的是一个线性可分的问题,如果我们给出一条狗和一个汽车,一条线就可以把它们分开,这就是线性可分。但是当海量的狗和汽车或者是其他的样本加入的时候,并且有很多的线索,你无法通过线性的方式把它分还,这个时候就要加入中间层,就变成了多层感知器,来解决线性不可分的问题的。多层感知器就是在模拟神经网络,自从1986年BP算法流行开来以后,DNN模型得到快速发展。RNN就是在DNN的基础上模拟人脑记忆,使DNN具有“联系上下文”的能力。

  前面讲我们有了DMP标签,这些标签怎么用于广告的投放呢。传统的DSP公司都是通过优化师凭经验去使用标签优化广告效果,很多时间和资金就会浪费在广告的优化过程中。我们把DNN和RNN模型引入到广告点击预测中,目前得到的效果是对点击率有15%的提升。随着人工智能技术的发展及广告数据的不断积累,未来我们可以预测安装、激活、留存和回收,甚至可以预测一个游戏的整个生命周期。

  下面讲一下一些特殊的广告形式(互动广告)。2014年我们做过一些探索,包括跟搜狐视频、红牛等做过一些案例,改造传统广告的投放形式,让它具备语音交互能力,通过说话或者是哼唱歌曲,来跟广告进行交互,达到广告效果的同时还能提升用户的体验。更重要的是通过跟用户的语音交流,能获取很多用户对产品的反馈,这个反馈也能成为数据的重要来源。

  最后总结一下,优数是这样一家公司:

  首先,优数虽然是一家创业型公司,但我们能精准营销、场景营销,有自己的智能算法,有互动广告形式,有讯飞ADX的优质媒体资源,同时我们能进行跨屏营销,是一个一站式的互动营销平台。优数的愿景是:以优质数据,助力移动营销。

  我的分享就到这里,谢谢大家。

  2016第十二届TFC大会简介:

  2016年TFC品牌全面升级,跨界整合“B C”双端资源,携“第十二届TFC全球移动游戏大会暨智能娱乐展”和“TAC漫游展”两大展会重磅来袭,深入影响游戏与智能娱乐业界精英,辐射全国50万二次元人群,打造最强漫游资源矩阵。B端展会将覆盖移动游戏、VR/AR、智能玩具和硬件、 HTML5游戏、二次元产业、影视泛娱乐IP等多个领域,C端展会将专精二次元,利用国人自制、专业团队、优质原创的强大优势,打造“音影漫游”全景式互动体验。

0