怎么使编程可以用语音输入吗音

我是一个喜欢编程的技术宅非科班出身,半路出家自学编程,这几年学了C++,JAVA 数据库前端,几乎编程语言都涉猎过这是我耗费了一个月时间自己开发的一款语音识别洎动字幕添加的软件,用的是腾讯语音识别引擎视频编辑用的是ffmpeg,后台及官网用的是Java网站前端就是简单的下载展示。这是这款软件的介绍

字幕助手是一款免费利编程可以用语音输入吗音识别技术的视频字幕添加软件,这款软件主打视频字幕剪辑和添加功能能够一键赽速添加字幕,同时能够快速导出srt字幕该软件还具有一键去水印功能,软件可以将繁琐的视频字幕翻译制作工作最大程度的便捷化成功实现从切分时间轴、字幕语音识别,到字幕校队字幕特效制作及成品导出。

可通过本地视频上传方式、视频列表中查找历史视频记录嘚方式将视频导入工具中,将视频导入工具直接对在线视频进行制作编辑

①.本地视频制作:直接将电脑中已下载的视频导入软件

②.查找曆史视频:可在“视频列表”中查找历史视频资料

通过语音进行识别和字幕自动编辑为确保准确度,后期可在字幕文本框进行二次校对若持有视频对应字幕的srt格式文件,可用导入字幕方式直接将字幕导入视频。

①通过语音自动识别:进行字幕自动识别时可根据情况進行选择

②字幕编辑校对:自动识别后,需进行人工二次校对在相应字幕编辑框中自行编辑即可。

③导入字幕:若持有视频的SRT文本字幕可不用自动识别直接选择“导入字幕”然后进行确认校对即可。

通过对字幕大小、字体形式、字体颜色、对齐格式进行选择得到想要芓幕效果。

整体调整时间线:通过此功能可将所有时间轴统一提前或延后

导出方式分为字幕文本格式导出、字幕视频格式导出两种方式,可根据不同需求选择不同方式

①字幕文本导出:字幕文本导出为SRT格式文本,其中包括字幕和和对应时间轴用户可根据个人所需选择導出译文字幕、原文字幕。

②字幕视频导出:视频导出为原来的视频格式格式用户可根据个人所需选择导出视频。

为了避免广告嫌疑這里就不能放下载链接了,你可以百度搜索字幕助手或者私信我,输入:字幕 会自动回复下载地址

如何利编程可以用语音输入吗音識别功能来判断读出的文字是否正确,如果正确则显示下一个词,这有点像小学生的生词朗读练习匆匆做了一个例子,来说明如何使编程可以用语音输入吗音识别组件以及如何处理识别结果。

这里上传了两个小图片分别为对勾和叉号,用于显示语音识别的结果与原文是否一致

在编程视图中,首先声明三个变量如图:

“单词列表”用于保存需要被朗读的文字,可以是中文也可以是英文。在实際应用中可以将文字保存到文本文件中,词与词之间用逗号分隔并保存到手机sd卡的AppInventor/data文件夹下,在屏幕初始化时用文件管理器组件加載该文件,并将收到的文本用逗号分解为列表

“标点列表”用于存放常用的标点符号。由于讯飞语音+在识别结果中会加入标点符号因此识别结果无法与原文完全一致,因此需要将识别结果中的标点符号去除定义一个“去标点”过程,如下图:

变量“索引值”用来记住當前正在显示的词如果朗读的识别结果与原文一致,则显示下一个词即,如果索引值小于单词列表的长度则让索引值+1,否则让索引值=1,代码如下:

代码中启动计时器是为了让对号显示一定时间(如1秒钟),然后消失并显示下一个词。代码如下图:

最后是屏幕初始化程序及开始按钮点击程序如下图:

屏幕初始化时,让计时器停止计时并显示单词列表中的第一题;点击开始按钮之后,会启动Android设備的语音识别功能在屏幕下方会出现麦克风,此时就可以朗读了

本例中使用了讯飞语音+来替代Android设备中默认的google语音识别,这样可以同时識别中英文语音+的下载地址为:/s/vCICwOOxQNkT

讯飞语音+ 有一项设置,可以在识别之前发出提示音这样用户体验会好一些。

加载中请稍候......

以上网友發言只代表其个人观点,不代表新浪网的观点或立场

我要回帖

更多关于 编程可以用语音输入吗 的文章

 

随机推荐