打字幕本身是个累人的技术活,如今点几下鼠标就搞定了
大家好我是T哥。
曾经,有个叫字幕组的东西,听起来他们干的活很简单,就是给视频加上字幕,实际上,以前给视频加字幕,跟如今比起来,就是一个技术活。你得会字幕软件,得会时间轴。而早期的字幕软件,即便是图形化的界面,我接触过,没有教程是完全不懂的自己瞎摸索,也摸索不懂到底怎么折腾。
而如今的字幕软件,同样是图形界面,真正做到了傻瓜式的操作,我自己摸索了10分钟,已经会从嵌入文本到顺利出产字幕的全过程,简单方便易懂。
但是,在那个时候,并不是说精通了字幕软件的操作,就可以让效率事半功倍了。就算你精通字幕软件,一样需要一句话一句话的对轴,这是没有任何捷径可走的,因为你对轴的是视频的内容,也就是语音,你打的字幕和语音没办法靠着某种捷径关联,不如说打字幕本身就是这个对齐的过程,所以可以说是相当费时了。我自己制作视频,所以知道其中的痛苦。如果制作一个5分钟左右的解说视频,可以说有30分钟甚至更久的时间是花费在对齐字幕和时间轴的过程中。如果是填满1个小时30分钟的剧场版动画的字幕,加上校正,那的确是一个费时费力的工程。
而如今的字幕软件,结合了AI语音识别的功能,也就是说,把视频的内容中,声音的部分,和你的文本的部分打通了把对齐字幕时间轴这个事情完全自动化完成。这就让我目瞪口呆了。也就是说,如今的字幕软件,只需要你嵌入已经写好的文本,利用语音识别,就能完成。原本需要一条条对轴的事情,现在,点几下鼠标就完成了。这大大节省了制作字幕的时间。
而且我试了,识别对轴的准确率非常高,基本只需要做一下轻微的调整,就能完成字幕的制作。看到这里我自己都傻了,都不知道为什么以前要花这么多时间在视频字幕的制作上
不过你也肯定想问了,这个语音识别岂不是只能应用于语音和文本是同一国的语言情况下,才能对齐语音和文本的时间轴?话是没错,但这个软件ARCTIMEPRO甚至还整合了翻译机的功能。比如说,有一段日文的内容,你想做翻译的字幕,它可以自动识别日语的语音,然后自动生成日文的字幕,再用机翻完成翻译。当然你会说,如今的机翻还是没有人工翻译这么流畅和准确,但我觉得机翻这个功能还是有使用场景的。如果语法特别正式,例如产品发布会、新闻报道等场合,用到的一些标准的词汇,那么机翻再稍加修饰基本就是可用的状态。而且随着机翻功能的迭代,它的效果一定会越来越好。
当然,这是机翻的不够成熟的导致的,而不是语音识别的或者说逻辑上的不合理导致的,目前的AI辅助字幕软件,我觉得已经消灭了字幕软件能想得到的所有痛点,并且给了你想要的一切功能曾经在打字幕这件事上觉得备受折腾的我,此时泪流满面。
字幕软件的AI化辅助,是我最近在生活中对于AI改变生活的强感知。以前可能需要一支团队来完成的字幕注入,现在可能只需要翻译一个人就能操作。大幅节省了人员和时间成本的投入。
还有刚才提到的机翻。
以上是我用的机翻软件,DeepL2,以前的机翻给人的印象就是,填词造句生硬,甚至狗屁不通,但如今的机翻,我说了,只要有合适的场景,它就可以获得理想的效果,我用机翻去外文网站学习,和老外用英文进行交流,即便是硬核话题也可以做到互相理解。其实我自己也不知道我说的对不对,但从上下文来看,我觉得老外们肯定是读懂了我的意思我有日语基础,也可以确信我和日本人用机翻可以顺利地沟通我觉得这个世界都因为这些技术的跃腾,变得越来越近,没有距离。
AI技术的迭代,给生活带来的是飞跃式的递进。再打个比方,寄快递,或者说X宝发货,每次都要填写繁琐的姓名、地址、电话的信息,非常麻烦。如今的AI填写,你只需要把这些信息一股脑粘贴上去,AI算法会帮你自动填写到姓名栏、地址栏、城市、电话号码的不同栏目中,你需要做的只是确认一下信息就可以顺利下单。这种技术的应用大幅提升了发快递的体验,真的是一键完成。
AI技术的如此快速的发展,很多事情都是23年前都想不到的。AI技术大幅节约了人们的劳动时间,提升了劳动效率。但也会有人担心,照这个发展的速度,AI全面替代人们繁琐的劳动,社会的结构是否也会发生改变?我觉得,这事情还是留给布局的人们去思考,我们即便胡思乱想,也改变不了这个趋势,所以,享受AI带来的便利就是我们需要做的。
放弃高配狠堆外观,小米CIVI这次方向对了前年小米专为女性打造的CC9,因为顾忌性价比,做得不像新系列,更像是小米6X的迭代产品。今年的小米CIVI改变巨大,放弃了性能配置,将成本更多地给到了外观、握感、以及自拍上。……
木兰重生的妙用,更多编辑器高亮所有相关源码在码云mulanrework这几天复现了木兰编程语言中的功能(细节见第二部分)。编辑器的代码段类原本(左侧)有12处self,改写后(右侧)看起来就简洁了一些……
焦点复盘个股迎来报复性反弹关注量能是否有效放大财联社11月4日讯,今日共97股涨停,16股封板未遂,封板率为86;吉鑫科技5连板,华亚智能4连板,香山股份3连板,创业板佳创视讯2连板。盘面上,收涨个股3311只,收跌个股1……
华为P系列高端机型盘点,性能足够打,颜值居上,网友拍照更好华为P系列是华为最早拥有的高端系列。华为P系列不仅有强大的性能,而且在拍照方面增加了新的辅助。这是一个高端的摄影系列。目前华为有三款P系列手机,值得消费者购买。从华为P3……
亿咖通科技紧跟时代步伐,研发行业领先的智能互联车载系统随着社会的发展,汽车产业在继电动化革命之后,开始进入了智能化和网联化时代,可以毫不夸张地说,汽车智能化是当今汽车产业最大的竞争点。亿咖通科技作为汽车科技公司,不断促进中国智能网……
直击郑州服装市场,网友不知有多少人会倾家荡产21日上午1011点终于停!雨!了!但仍然不可掉以轻心暴雨橙色预警依然拉响为河南祈祷!(图片来源于网络,侵删)郑州下了多大的雨?17日……
王思聪百万电脑配置清单昨天给大家发布了一个关于王校长组装电脑的视频,今天给大家详细讲解分析一下王校长电脑的配置!首先处理器是AMD最新的三代霄龙,64核128线程的版本,单颗就6万多,其实上面……
电芯强劲,高效转化,物色移动电源匠心之作随着移动电源越来越走进生活,越来越普及,如何选择一款适合自己的数码产品,它的必需性能强电能大,同时外形时尚美观,又可以携带方便的移动电源,那么请大家关注这款酷比魔方的新品:M2……
微信奥运红包封面彩蛋来了,快来领近日,看到微信推出了多个有关奥运会主题的相关活动,下面一起看一下,有的还蛮实用的。第一个,小伙伴可以通过微信支付有优惠小程序玩奥运主题跑酷小游戏,即可领取微信零钱的提现免……
有源音箱的噪音分类声拓电子音爵士有源音箱的噪音分类【声拓电子音爵士】按来源分类,有源音箱的噪音大致可分为电磁干扰、机械噪声和热噪声三种。一种,电磁干扰主要可以分为电源变压器干扰和杂散电磁波干扰。电……
国产伟哥90毛利终结?另一竞品将进全国公立医院,价格仅2元一在上个世纪90年代,为了寻找治疗心脏病的方法,美国辉瑞公司潜心研发了一款药品,这款药叫西地那非,只是让辉瑞的科研人员没有想到的是,这款药品在临床测试期间,竟然对男性勃起功能有着……
评测影像非常突出的优秀旗舰vivoX60ProX60Pro能让你应付各种各样的拍摄条件,能实现所想的各种拍摄效果,再配合优秀的屏幕,轻薄的手感,55W快充和线性马达,除了没有双扬声器,在它身上基本找不到什么短板X60……