纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

基于12000个智钻创意构建创意自动分类器

2月6日 碧落盟投稿
  文章导读:2016年是人工智能的爆发年,而人工智能基于海量数据。对于电商来说,智钻投放中产生大量投放数据,其中创意数据对于钻展效果分析来说尤为重要。基于4个月几百个商家,合计12000张创意可以为我们对日常创意效果的判断提供历史支持。因此,利用深度学习来训练出能够自分创意的想法油然而生。
  正文:
  对于商家来说,日常智钻投放中有大量创意需要替换更改,但是创意往往改完就算了,它的数据也随之舍弃。但是冷静一想,究竟对于我们日常投放来说,怎样效果的创意才是一张值得肯定的创意呢?怎样的创意数据才能代表广泛的商家心声呢?因此,本次项目基于7月到11月所有投放过钻展的商家创意数据,涵盖超过50个类目12000张创意,构建具有广泛代表性的创意分类模型,并从模型中找到对我们日常投放有指导意义的信息。
  一、智钻创意数据的量纲和维度
  所谓的量纲指的是每张创意数据所观察的时间范围,本次实验全部创意观察的量纲统一为1个月。而初始候选观察维度较多:
  数据的搜集通过协助商家推广的期间不断积累下来,3个月下来数据量在1W2左右。而我们实际当中,大家都认同真正好的创意相对来时较少,因此,我们通过长时间咨询智钻顾问人员,严格地把这些数据中真正比较好的创意挑选出来,其它列为一般的创意数据。整个实验就是围绕这些数据作为我们研究的样本。
  二、基于逻辑回归的分类器
  当样本初步整理好,尝试使用一般的逻辑回归来分类。一开始我想综合考虑所有智钻顾问对创意的分类的考虑,因此想模型设定为逻辑回归。模型去除了对时间量纲有依赖的维度。例如,消耗,因为不同商家可能会因为体量的大小而在本质上有差别;类似的维度还有展现和点击等。本次实验把这些维度全部去掉,保留没有依赖时间为量纲的点击率、点击单价和收藏率等维度。
  本次逻辑回归的最多迭代100次,拿数据当中的85作为训练,15作为验证集来训练模型。得到如下结果:
  真正率指的是所有被顾问认定为较好创意的数据,其中被模型预测为较好创意所占的百分比;真负率指的是所有被顾问认定为较差创意的数据,其中被模型预测为较差创意所占的百分比;准确率值得是所有数据当中,模型预测与源数据相符所占总数的百分比。可以轻易看出,真负率比较高,但真正率较低。所以本实验对于那些较好创意的预测准确性不够高。
  逻辑回归中各维度的参数如下:
  参数说明:维度当中的参数的正负说明该维度对模型预测为较好创意的贡献方向,例如:点击单价的参数为负数,说明点击单价越高,越不能对其预测较好创意,所以方向是负的;而点击率参数为正数,说明点击率越高,越能对其预测为较好创意,所以方向是正的。
  从这个表中有如下结论:
  综合所有数据,顾问对于一张创意是否为一张好的创意,最重要看的维度从高到底是点击率、收藏率、加购率和回报率。这三者可以起到决定性的作用;
  点击单价、收藏成本和加购成本的决定作用在第二阶级,其决定性因素不如第一点提到的因素。
  三、去除依赖时间的数据维度的SVM分类器
  由于逻辑回归对于真正率来说不够高,因此想用SVM分类器(SuportVectorMechine)。虽然其训练效率低,当时它对于低维密实的向量有较好的敏感性,所以尝试使用它来做为此训练。模型训练参数中伽马等于2,阈值为1e4,训练结果如下:
  与逻辑回归相比,真正率大幅升高,而且整体的准确率也得到提高,所以该模型作为一个候选模型。
  四、基于Dense网络的分类器
  当使用SVM分类器时,发现虽然整个模型的准确率很高,但是真正率、真负率和准确率三者还是有一定差异,这导致整个模型预测的结果不稳定,很容易在以后的使用当中,因为数据结构不同而导致预测准确性受到质疑。再者SVM的参数调整太过于麻烦,而且其预测速度太慢,因此想找更优的方法。
  最后,我确定了使用Dense网络,它与一般的全连接网络区别在于它对于隔层网络数据是有复用的,与传统全连接网络只与邻接层有关大大不同。这一特点使得它有诸多优点:
  (1)有效解决梯度消失问题;
  (2)强化特征传播;
  (3)支持特征重用;
  (4)大幅度减少参数数量。
  因此,对于少维度的输入,其复用特征有利于梯度的反馈。模型的当中的反馈函数使用”relu”,它比一般的“sigmod”更灵活,为了避免过拟合,每层网络训练完一次后都会有50的几率抑制神经元,训练次数设定为100次,学习训练优化器使用自适应动态二阶学习函数:“RMSprop”。基于以上数据搭建Dense网络,而网络输入的是每个创意数据,输出是该创意是否为优质创意。
  在训练网络的过程中,发现去除时间维度的数据有可能影响整个网络的训练。就是有相当一部分创意,它的收藏率、加购率和回报率等维度都为0,因为这种数据过多,导致网络对不好的创意判断出现了偏差,对非优质创意的预测能力有下降。因此在样本的处理上,对这些数据有了删减。
  神经网络与前两种相对比,发现真正率、真负率和准确率三者非常接近,而且都比之前的高,并且通过多次训练都得到相似的结果。说明对于本次实验来说,使用神经网络的效果稳定性总是优于前两者,因此选择其作为最终的预测模型。
  五、初步实践运用
  既然已经有了模型,那我们以后只要输入某张创意的信息,模型立刻就可以输出它是较好创意还是一般的创意,而且该创意有多大的可能性是好创意,有多大可能性是一般创意。
  例如,我们有一张创意,近30天数据如下:〔2,7,1。8,0。08,0。01,0。02,86,80,0。6〕,这代表它是奶粉辅食营养品零食类目,第七层级,点击单价是1。8,点击率8,收藏率1,加购率2,收藏成本86元,加购成本80元,点击回报率是0。6。
  从运行结果截图可以看出,输出结果为零,即预测为较一般的创意;而且它被预测为一般创意的概率达到95,被预测为较好创意的概率只有5,因此它只能被当做较一般的创意。
  例如,我们有一份十二月的创意数据,然后我们逐个输入来预测,预测出来的结果我们就可以主动告诉智钻操作人员有哪些创意不太好,需要更改;哪些创意表现较好,继续仿照风格文案出创意,大大降低人工筛选分析的时间,把更多的时间投入到店铺本身的工作中。
  六、总结:
  当我们拥有大量数据时,我们应该做的是让它指导我们的工作;当我们懂得如何让历史指导我们工作的时候,就应该让它成为一种模型化的标准来自动执行。所以,通过大量数据构造创意分类器的模型,以后我们只需要定期训练模型,它就能自动地按照以前智钻顾问的想法分类创意。
  一来可以降低人工成本,解放更多的生产力,让顾问有更多的时间去做店铺的事情,而不是重复分析;二来可以让模型成为一个统一的分析标准,避免因为人为的原因对店铺分析有双重标准。让创意得到更公平更广泛的判断。
  本次实验也找到一些亮点,对于本次实验的数据来说,一张好的创意其实考虑较多的是点击率、收藏率、加购率和回报率等维度,这可以帮助我们以后的操作人员需要更加关注这些维度来分析创意。
  通过本次项目,可以由创意数据作为一个出发点,让更多的电商数据训练为模型,使得推广更加智能,让电商真正沐浴在人工智能的阳光下。
  作者:大麦电商,电商问题交流微信damaie
  原创稿件,转载请注明来源卖家资讯http:www。maijia。comnews
投诉 评论 转载

淘宝卖家在淡季应该怎么办?淘宝淡季如何解决?我们应该充分利用淡季时间,保持市场占有率,到了旺季,会因为消费者对品、产品的曝光率优势从而产生品牌喜好,在旺季时能有效和竞争对手拉开差距,淘宝淡季如何解决?如……淘宝直通车关键词怎么样优化?直通车推广很多朋友做过,效果有好也有坏,我们在得不到自己预想中的推广效果时,就要开始找原因了,影响效果的原因有很多,关键词是最重要的一个,那么怎样优化直通车关键词呢?(1……实战:如何玩转直通车的店推直通车给大家的印象是大多数是单品的引流,很多人可能忽略掉直通车能像钻展一样,进行店铺整店或者集合页的推广,它的存在有它独特的魅力能补充直通车在页面推广上面的一些不足。一、……微商怎么找客源?微商加人方法揭秘找客源最根本的方法就是精准引流,让对你产品感兴趣的客户主动的来加你。这一部分人就是你的精准粉丝。不要盲目的去使用什么加人软件,也不要相信所谓的买卖精准客源的人。那样的都是骗子!……直通车质量得分优化怎么做?直通车的质量分低,那就代表着我们需要更大的成本去进行直通车推广,如果你直通车店铺推广质量分降分,一定要想办法提升,不想让自己的成本过高,这是最好的办法,那么直通车质量得分优化怎……农村淘宝集单活动报名须知农村淘宝商家除了在后台进行农村淘宝集单活动报名,还需要了解一些关于农村淘宝集单活动报名的重要信息。一、哪些商家可以参与农村淘宝集单活动?目前只有村淘入驻商家可以参与……2017年的企业店铺应该怎么玩儿?1。这个店铺的基本问题有哪些呢?这个店铺经营了大概半年的时间,目前有两个人在做,每天的销售额大概在500块钱左右,主要流量来自于自然搜索,店铺有过违规行为,被处罚过。……淘宝必读:巧用上下架时间获取排名权重每个运营都有自己关于上下架时间的玩法。而且上架时间在每个人眼里的重要度是不一样的的。今天在这里给大家分享一下,我关于上下架时间是如何去确定的,以及关于上下架时间的逻辑。之……存亡第一战:新店新品运营必备技能优匙说刚开的网店怎么做才能有客户?电商平台是依据什么来扶持刚开业的中小卖家的?产品上架后如何引流,如何转化?这些问题,都可以在新品运营中得到答案。对于新店而言,新品运营尤……基于12000个智钻创意构建创意自动分类器文章导读:2016年是人工智能的爆发年,而人工智能基于海量数据。对于电商来说,智钻投放中产生大量投放数据,其中创意数据对于钻展效果分析来说尤为重要。基于4个月几百个商家,合计1……电商设计小白的逼格蜕变我是一名设计助理,和许多人一样,刚开始接触电商时对设计这方面一窍不通,总是羡慕别人设计的图如何好,自己却总是做不出来。但经过一段时间的锻炼和积累,从当初的反复修改到现在的一稿过……不重视这四个关键点,店铺死亡非常简单在电子商务盛行的年代,基本上有用电脑,用手机的人,不分年龄层面,都对网购有或多或少的理解,逛网店已经成为现代人的一种生活习惯。而有很多手上有资源的朋友,都想冲进这个深似海的电商……
双11前如何利用直通车打造爆款?提到流量不再头疼!店铺获取流量方法大集合我们常说的转化率到底是什么?2017双11期间手淘钻展资源位将有所调整卖家获取中差评的原因有哪些?选词的基本标准和原则想要得到直通车的点击,也要注意投入产出双11直通车数据分析技巧店铺如何做好客服培训,打造金牌客服团队?店铺宝贝定价的误区及如何制定合适的价格这六点,每个淘宝卖家都必须要知道!玩转手淘搜索流量,提升店铺转化

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形