这篇文章在去年6月首发于面包多,是我的第一篇付费作品,在一年后,我将它完全免费公布出来,并加上了一些更新内容,希望能对更多开发者或对产品有热爱的人提供一些参考和灵感。 2019年4月,我打算拍Vlog,之所以要做这件事,其实也没有太多理由,主要就是因为在微博和B站看到好多人拍,就也想试试。 我当时买了一箱军罐头,然后拍了吃罐头的一个Vlog,拍完之后,我觉得我说话不是特别清晰,于是就想着搞个字幕,但是我发现,搞字幕这件事太他妈复杂了。 按照传统的办法,需要人手动把听到的话写下来,然后再在合适的时间插入进去,合适的时间包括起始两个时间点,这几乎是双倍的工作量了,这还不包括软件的学习成本(Pr,FCP等)。 那有没有简单一点的办法呢?经过我的一番搜索,我发现网易和讯飞提供机器识别的服务,但是价格嘛,emmm 讯飞比较便宜,0。33分钟,网易就比较坑了,机器最便宜也是1块分钟。 这两家我也都用了,我发现有一点很不人性化:网易也好讯飞也好,最后只会给你一个SRT的字幕文件,并不会给你加好字幕的视频,对于专业做视频的人来说当然很简单,但对于我这种偶尔才拍一个视频,寄希望于得到一个加好字幕的视频,然后去上传B站,微博的人来说,有那么一点鸡肋,因为我还是得打开Pr,FCP这种大软件去导入然后渲染,这样总共几个小时还是少不了。 那么,有没有可能做一个纯粹的加字幕工具呢? 这是我灵感的来源:通过自己遇到的问题不能被很好满足所带来的需求。 接下来的一周,我每天大概花5个小时来开发这样一个字幕工具,从技术上来说,核心的难点在识别语音和时间轴,这一点我花了不少时间,但通过爆改已有的轮子,还是实现了出来(ffmpeg大法好)。不过除了核心之外,这个产品有许多细节要注意,比如SRT的文件格式,时间轴编辑等等。 我花了大约5天来开发这个产品,在搞定语音识别之后,其他部分都是一些CRUD的活儿,这个很快就能完成。 最终实现的产品有如下功能: 自动翻译并生成双语字幕是第二周根据用户的需求加上的,直接使用了百度翻译的API,效果还不错。 关于这个产品应该叫什么名字,我花了一些时间来想,我首先想到的是视频to字幕,然后就想到了to字幕,然后想到了突字幕这个名字,感觉还行,就直接用了。 4月26日,产品做好之后,我在一些常规渠道做了很简单的推广:知乎发帖,豆瓣摄影小组发帖,然后投稿给了少数派,小众软件等媒体,当天差不多来了400人。 当然你可以看到,第二天流量就下降了一小半,事实上,产品在渠道新曝光之后,如果没有持续的运营策略,数据是肯定会掉的。 意外发生在第三天,少数派发完贴后,我在文末加了一句回复你的ID,免费赠送600点数,这个做法让我的帖子相当活跃,一天之后,少数派的创始人老麦看到了这个帖子,顺手发到了微博上,老麦的这条微博在短暂发酵后一路扶摇直上,获得了超过5万次转发。 这条微博的阅读量超过千万,在让老麦升级成为金V的同时,也让突字幕迎来了流量的峰值: 当天超过2。5万人访问突字幕,其中一万人注册成为用户,并上传了总共超过1TB的视频。 因为不确定产品可能存在的问题,所以我使用了客服组件tidio,这是一个国外的产品,它最大的优点是非常简单,而且好看,我知道国内有美洽之类的产品,但是由于审美不符合,所以我比较抗拒。 通过tidio,有上百名用户过来和我留言,他们说到了大量的突字幕的问题,以及希望得到的feature,我把这些都记录了下来,并且制定了更新计划,预计在未来一段时间里逐渐更新。 在收入方面,突字幕的数据还算不错,总付费率为7 突字幕使用微信收款,收费方式为点数充值,2019年的5月一整月的收入为2万出头: 我对于这个数据挺满意的,不过之后的几个月数据有不少下滑,一方面是因为微博热度过去的,流量下降了一部分,另一个原因是产品确实还不够好,没有满足很多用户的期待。 在增长方面,我一共在产品内部嵌入了两个功能,一个是免费获得点数,一个是推广突字幕赚钱,这两个功能都是在产品上线4个月之后才开始加入的,理由我稍后会写。 当用户用突字幕给视频加了字幕后,多半会发在某个地方,比如微博啦,B站啦,头条啦什么的,这时候如果用户在发视频的地方介绍一句突字幕,我就会返还他处理这个视频所消耗的点数。 我用一个表单来实现这个功能,让用户手动填写表单 当用户填写表单后,我会收到微信通知,然后搂一眼是不是真的,如果是真的就通过直接改数据库给他返还点数(是的我根本没做后台之类的东西) 推广突字幕赚钱则是一个最简单的分销,总的来说它的效果反而还没免费获得点数的效果好。 这就是我在产品里面加入的所有增长措施。 突字幕让我明白的最重要的事情之一是,有时候,在产品早期,凭靠好运气获得大流量也不一定是一件好事,如果产品准备的还不好,那么就会有许多用户白白流失掉,突字幕在巨大流量涌入后,因为产品还不够完善,用户的流失比较严重。 由此可知,任何产品,在早期都不可能是尽善尽美的,如果打分从1到100分,1分意味着产品什么功能都没有,体验糟糕,100意味着绝对的完美,那么大多数产品,可能都介于40分80分之间,问题是,产品该达到多少分,才能让我们有信心的推入市场,甚至迎接突如其来的爆发流量,并且能在此后不惋惜要是产品准备的再完善一点就好了 这个问题并非一句越完善越好就能回答,因为花在产品上的时间越多,不确定性越多,也可能造成机会的错失。因此,我们不可能等产品做到接近100分才将其发布:时间,预算,甚至市场都无法等待这么长时间。 我的答案是65分,这个分数意味着产品满足核心需求,体验略高于平均水平,其余诸如增长模型,花哨的邀请分享按钮,后台统计管理(一般数据看Googleanalytics,业务数据直接看数据库),少部分浏览器的适配,可能会对用户有用但不是核心需求的功能等等,都暂且放下,这样一个产品,就是65分的产品,如果能达到这个标准,就立刻拿去接受市场和用户的检验。 我的逻辑是,如果你的产品不能满足核心需求,或者产品体验糟糕,那么大多数用户会愤怒的离开,不要奢望他们点你精心设计的分享按钮他们不在社交网络上骂人就谢天谢地了,他们自然也不会关心其他非核心功能。而如果你把核心需求解决了,产品体验也尚可,如果这个需求真的存在,那么,他们是会回来的,验证这一点,然后赶紧把其他该做的做出来,终有一刻,他们是一定会点分享按钮的~ 突字幕现在已经更新了一个版本,这次我和同事一起,努力把这个产品从由一个idea诞生的独立开发作品变成一个小而美的精致工具。我毫不隐藏:我希望突字幕能够成为赚钱机器,但我也发自内心的希望这是一个帮助人们增加效率的,被大家喜爱的工具,并且我还坚定的认为,这两者不仅毫不冲突,且息息相关。 2020年7月9日后记 2019年的46月,我把突字幕改了几个版本,并在2019年6月完全成型,你现在看到的,就是那个时候的版本。 到今天,字幕识别这个市场已经发生了比较大的变化,诸如剪映等一系列App都集成了字幕识别功能,且效果和体验都非常棒,这近一步压缩了突字幕的目标市场,但因为对长视频的支持,突字幕还是有比较稳定的用户和收入,不过大概只有最高峰时候的一半到三分之一,也就是每月大几千元的收入。 和我之前做的小工具一样,突字幕是一个无需干预,无需运营的产品,我除了看用户反馈外,一周花在它上面的时间不到一个小时,从好的一方面说,它是一个完全标准的被动收入机器,但实话实说,它也很难成长为一个更大的机会。 总的来说,悠闲的事情往往不赚钱,赚钱的事情往往不悠闲,既悠闲又赚钱的事情,反正我是没见着。