有没有将ros，语音，ros 人脸识别，导航融合在一起的平台

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>软件 >>有没有将ros，语音，ros 人脸识别，导航融合在一起的平台

有没有将ros，语音，ros 人脸识别，导航融合在一起的平台

来源：蜘蛛抓取(WebSpider) 时间：2016-09-23 07:50 标签：人脸融合

ROS机器人开源系统 - 掌握主动科技（北京）有限公司
ROS机器人开源系统
发布时间：来源方式：原创
随着机器人领域的快速发展和复杂化，代码的复用性和模块化的需求原来越强烈，而已有的开源机器人系统又不能很好的适应需求。2010年Willow Garage公司发布了开源机器人系统ROS（robot operating system），很快在机器人研究领域展开了学习和使用ROS的热潮。
一、ROS的发展史
ROS系统是起源于2007年斯坦福大学人工智能实验室的项目与机器人技术公司Willow Garage的个人机器人项目（Personal Robots Program）之间的合作，2008年之后就由Willow Garage来进行推动。已经有四年多的时间了 (视频)。随着PR2那些不可思议的表现，譬如叠衣服，插插座，做早饭，ROS也得到越来越多的关注。Willow Garage公司也表示希望借助开源的力量使PR2变成&全能&机器人。
二、设计目标
ROS是开源的，是用于机器人的一种后操作系统，或者说次级操作系统。它提供类似操作系统所提供的功能，包含硬件抽象描述、底层驱动程序管理、共用功能的执行、程序间的消息传递、程序发行包管理，它也提供一些工具程序和库用于获取、建立、编写和运行多机整合的程序。
ROS的首要设计目标是在机器人研发领域提高代码复用率。ROS是一种分布式处理框架（又名Nodes）。这使可执行文件能被单独设计，并且在运行时松散耦合。这些过程可以封装到数据包（Packages）和堆栈（Stacks）中，以便于共享和分发。ROS还支持代码库的联合系统。使得协作亦能被分发。这种从文件系统级别到社区一级的设计让独立地决定发展和实施工作成为可能。上述所有功能都能由ROS的基础工具实现。
三、ROS的主要特点
ROS的运行架构是一种使用ROS通信模块实现模块间P2P的松耦合的网络连接的处理架构，它执行若干种类型的通讯，包括基于服务的同步RPC（远程过程调用）通讯、基于Topic的异步数据流通讯，还有参数服务器上的数据存储。但是ROS本身并没有实时性。
&ROS的主要特点可以归纳为以下几条：
& & &1、点对点设计
一个使用ROS的系统包括一系列进程，这些进程存在于多个不同的主机并且在运行过程中通过端对端的拓扑结构进行联系。虽然基于中心服务器的那些软件框架也可以实现多进程和多主机的优势，但是在这些框架中，当各电脑通过不同的网络进行连接时，中心数据服务器就会发生问题。& & & ROS的点对点设计以及服务和节点管理器等机制可以分散由计算机视觉和语音识别等功能带来的实时计算压力，能够适应多机器人遇到的挑战。
&&&&&&&2、多语言支持
在写代码的时候，许多编程者会比较偏向某一些编程语言。这些偏好是个人在每种语言的编程时间、调试效果、语法、执行效率以及各种技术和文化的原因导致的结果。为了解决这些问题，我们将ROS设计成了语言中立性的框架结构。ROS现在支持许多种不同的语言，例如C++、Python、Octave和LISP，也包含其他语言的多种接口实现。
ROS的特殊性主要体现在消息通讯层，而不是更深的层次。端对端的连接和配置利用XML-RPC机制进行实现，XML-RPC也包含了大多数主要语言的合理实现描述。我们希望ROS能够利用各种语言实现的更加自然，更符合各种语言的语法约定，而不是基于C语言给各种其他语言提供实现接口。然而，在某些情况下利用已经存在的库封装后支持更多新的语言是很方便的，比如Octave的客户端就是通过C++的封装库进行实现的。
3、精简与集成
大多数已经存在的机器人软件工程都包含了可以在工程外重复使用的驱动和算法，不幸的是，由于多方面的原因，大部分代码的中间层都过于混乱，以至于很困难提取出它的功能，也很难把它们从原型中提取出来应用到其他方面。
为了应对这种趋势，我们鼓励将所有的驱动和算法逐渐发展成为和ROS没有依赖性单独的库。ROS建立的系统具有模块化的特点，各模块中的代码可以单独编译，而且编译使用的CMake工具使它很容易的就实现精简的理念。ROS基本将复杂的代码封装在库里，只是创建了一些小的应用程序为ROS显示库的功能，就允许了对简单的代码超越原型进行移植和重新使用。作为一种新加入的有优势，单元测试当代码在库中分散后也变得非常的容易，一个单独的测试程序可以测试库中很多的特点。
&ROS利用了很多现在已经存在的开源项目的代码，比如说从Player项目中借鉴了驱动、运动控制和仿真方面的代码，从OpenCV中借鉴了视觉算法方面的代码，从OpenRAVE借鉴了规划算法的内容，还有很多其他的项目。在每一个实例中，ROS都用来显示多种多样的配置选项以及和各软件之间进行数据通信，也同时对它们进行微小的包装和改动。ROS可以不断的从社区维护中进行升级，包括从其他的软件库、应用补丁中升级ROS的源代码。
4、工具包丰富
为了管理复杂的ROS软件框架，我们利用了大量的小工具去编译和运行多种多样的ROS组建，从而设计成了内核，而不是构建一个庞大的开发和运行环境。
这些工具担任了各种各样的任务，例如，组织源代码的结构，获取和设置配置参数，形象化端对端的拓扑连接，测量频带使用宽度，生动的描绘信息数据，自动生成文档等等。尽管我们已经测试通过像全局时钟和控制器模块的记录器的核心服务，但是我们还是希望能把所有的代码模块化。我们相信在效率上的损失远远是稳定性和管理的复杂性上无法弥补的。
&&&&&&&5、免费且开源
ROS所有的源代码都是公开发布的。我们相信这将必定促进ROS软件各层次的调试，不断的改正错误。虽然像Microsoft Robotics Studio和Webots这样的非开源软件也有很多值得赞美的属性，但是我们认为一个开源的平台也是无可为替代的。当硬件和各层次的软件同时设计和调试的时候这一点是尤其真实的。
&ROS以分布式的关系遵循这BSD许可，也就是说允许各种商业和非商业的工程进行开发。ROS通过内部处理的通讯系统进行数据的传递，不要求各模块在同样的可执行功能上连接在一起。如此，利用ROS构建的系统可以很好的使用他们丰富的组件：个别的模块可以包含被各种协议保护的软件，这些协议从GPL到BSD，但是许可的一些&污染物&将在模块的分解上就完全消灭掉。
四、ROS的总体框架
根据ROS系统代码的维护者和分布来标示，主要有两大部分：
& & &（1）main：核心部分，主要由Willow Garage公司和一些开发者设计、提供以及维护。它提供了一些分布式计算的基本工具，以及整个ROS的核心部分的程序编写。
& & &（2）universe：全球范围的代码，有不同国家的ROS社区组织开发和维护。一种是库的代码，如OpenCV、PCL等；库的上一层是从功能角度提供的代码，如人脸识别，他们调用下层的库；最上层的代码是应用级的代码，让机器人完成某一确定的功能。
一般是从另一个角度对ROS分级的，主要分为三个级别：计算图级、文件系统级、社区级。
&&&& 1、计算图级
计算图是ROS处理数据的一种点对点的网络形式。程序运行时，所有进程以及他们所进行的数据处理，将会通过一种点对点的网络形式表现出来。这一级主要包括几个重要概念：节点（node）、消息（message）、主题（topic）、服务（service）
2、文件系统级
&ROS文件系统级指的是在硬盘上面查看的ROS源代码的组织形式。
&ROS中有无数的节点、消息、服务、工具和库文件，需要有效的结构去管理这些代码。在ROS的文件系统级，有以下几个重要概念：包（package）、堆（stack）。
ROS的社区级概念是ROS网络上进行代码发布的一种表现形式。结构如下图所示：
代码库的联合系统。使得协作亦能被分发。这种从文件系统级别到社区一级的设计让独立地发展和实施工作成为可能。正是因为这种分布式的结构，似的ROS迅速发展，软件仓库中包的数量指数级增加。
新闻中心当前位置： &&新闻中心新闻中心ROS操作系统的入门资料_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
ROS操作系统的入门资料
上传于||文档简介
&&ROS操作系统的入门资料
阅读已结束，如果下载本文需要使用0下载券
想免费下载更多文档？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩117页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢点击上方“公众号”可订阅哦！　　ROS为Robot Operating System（机器人操作系统）的简写，是一个面向机器人的开源元操作系统（open-source，meta-operating system）。它能够提供类似传统操作系统的诸多功能，如硬件抽象、底层设备控制、进程间消息传递和程序包管理等。此外，它还提供相关工具和库，用于获取、编译、编辑代码以及在多个计算机之间运行程序完成分布式计算。ROS的运行架构是一种使用ROS通信模块实现模块间P2P的松耦合的网络连接的处理架构，它执行若干种类型的通讯，包括基于服务的同步RPC（远程过程调用）通讯、基于Topic的异步数据流通讯，还有参数服务器上的数据存储。1历史ROS起源于2007年前后斯坦福大学人工智能实验室的STAIR（Stanford Artificial Intelligence Robot）项目与Willow Garage公司的个人机器人项目（Personal Robotics project）之间的合作。在2009年初推出了ROS0.4，现在所用系统的框架在这个版本中已初具雏形。经过近一年的测试后，于2010年初推出了ROS1.0版,并在当年三月份推出了正式发行版本：ROS Box Turtle，到现在（2016年5月）已经发行了10个版本，最新版本是ROS Kinetic Kame。比较有趣的是，ROS各版本均以龟作为发行代号，至今已设计出10种造型奇特的“ROS龟”。　　从2008年至2013年，ROS主要由Willow Garage公司管理维护，但这并不意味着ROS是封闭的系统，相反，它是由众多学校及科研机构联合开发及维护的，这种联合开发模式也为ROS系统生态的构建与壮大带来有力的促进。　　2013年，Willow Garage公司被Suitable Technologies公司收购，此前几个月，ROS的开发和维护管理工作被移交给了新成立的开源基金会 Open Source Robotics Foundation。2ROS系统有什么特点？ROS的主要目标是为机器人研究和开发提供代码复用的支持。ROS是一个分布式的进程（即“节点”）框架，这些进程被封装在易于被分享和发布的程序包和功能包中。ROS也支持一种类似于代码储存库的联合系统，这个系统也可以实现工程的协作及发布。可以使一个工程的开发和实现从文件系统到用户接口完全独立决策（不受ROS限制）。同时，所有的工程都可以被ROS的基础工具整合在一起。　　ROS在某些程度上和其他常见的机器人架构有些相似之处，如：Player、Orocos、CARMEN、Orca和Microsoft Robotics Studio。对于简单的无机械手的移动平台来说，Player是非常不错的选择。ROS则不同，它被设计为适用于有机械臂和运动传感器的移动平台（倾角激光、云台、机械臂传感器）。与Player相比，ROS更有利于分布式计算环境。当然，Player 提供了较多的硬件驱动程序，ROS则在高层架构上提供了更多的算法应用（如集成OpenCV的视觉算法）。　　ROS的主要特点可以归纳为以下几条：　　（1）点对点设计　　ROS通过点对点设计以及服务和节点管理器等机制可以分散由于计算机视觉和语音识别等功能带来的实时计算压力，这种设计能适应服务机器人遇到的调战。　　（2）不依赖编程语言　　ROS支持多种现代高级编程语言，C++、Python和Lisp语言已经在ROS中实现编译，并得到应用，Octave和Java的测试库也已经实现。为了支持多语言编程，ROS采用了一种语言中立的接口定义语言（language-neutral interface definition language,IDL )来实现各模块之间的消息传送。机器人越来越火，我们来谈谈它的那些“ROS龟”们　　（3）精简与集成　　ROS建立的系统具有模块化的特点，各模块中的代码可以单独编译，而且编译使用的CMake工具使它很容易的就实现精简的理念。ROS基本将复杂的代码封装在库里，只是创建了一些小的应用程序为ROS显示库的功能，这就允许了对简单的代码超越原型进行移植和重新使用。作为一种新加入的有优势，单元测试当代码在库中分散后也变得非常的容易，一个单独的测试程序可以测试库中很多的特点。　　ROS不修改用户的主函数，所以代码可以被其他的机器人软件使用。其优点是ROS很容易和其他的机器人软件平台集成。例如，在计算机视觉方面，ROS已经与OpenCV实现集成。在驱动、导航和模拟器方面，ROS已经与Player系统实现集成。在规划算法方面，ROS也已与OpenAVE系统实现集成。　　（4）便于测试　　为机器人开发软件比其他软件开发更具挑战性，主要是因为调试准备时间长，且调试过程复杂。况且，因为硬件维修、经费有限等因素，不一定随时有机器人可供使用。ROS提供两种策略来解决上述问题。　　1.精心设计的ROS系统框架将底层硬件控制模块和顶层数据处理与决策模块分离，从而可以使用模拟器替代底层硬件模块，独立测试顶层部分，提高测试效率。　　2.ROS另外提供了一种简单的方法可以在调试过程中记录传感器数据及其他类型的消息数据，并在试验后按时间戳回放。通过这种方式，每次运行机器人可以获得更多的测试机会。例如，可以记录传感器的数据，并通过多次回放测试不同的数据处理算法　　（5）开源　　ROS遵从BSD协议，这给了使用者很大的自由，使开发者可以清楚的查看、自由的使用源代码，如果有需要，可以根据不同的系统及硬件环境对源代码进行修改，或者进行二次开发。　　（6）强大的库及社区：　　ROS提供了广泛的库文件实现以机动性、操作控制、感知为主的机器人功能。同时由于其开源特性，ROS的支持与发展依托着一个强大的社区。其官方网站尤其关注兼容性和支持文档，提供了一套“一站式”的方案使得用户得以搜索并学习来自全球开发者数以千计的ROS程序包。3小结随着技术的发展及人们需求的提高，机器人集成了越来越多的功能、传感器，对用户来说这越来越方便，但对开发者来说恰恰相反，功能的增加带来开发与集成难度迅速上升，机器人操作系统的出现有效缓解了这种问题。　　从计算机和智能手机的发展过程来看，合适与成熟的操作系统是智能机器人行业大规模发展和在人们的生活中普及的必要条件。可以预见，未来几年将会出现众多机器人操作系统，在经过充分的发展竞争后将会有为数不多的几个操作系统会发展壮大并占据绝大部分市场，就像曾经的计算机操作系统和现在的手机操作系统。　　【附】：ROS方面的一些参考资料：　　1.《开源机器人操作系统——ROS》（张建伟等编）　　2.《机器人操作系统(ROS)浅析》（ Jason M. O'Kane著）　　3.《Learning ROS for Robotics Programming》（Aaron Martinez等著）　　4.《ROS By Example》（Patrick Goebel著）　　5. ROS官方wiki更多精彩【头条】还记那刷爆朋友圈的“最牛停车机器人”吗？第一座停车库将落户南京
科学家操碎心！让机器人也能感到疼痛
【解读】加快形成较为完善的机器人产业体系——工信部相关负责人解读机器人产业发展规划
【头条】中国工厂里，正悄然酝酿一场势不可挡的机器人革命来源：人机与认知实验室免责声明：本文系网络转载，版权归原作者所有。但因转载众多，或无法确认真正原始作者，故仅标明转载来源，如涉及作品版权问题，请与我们联系（联系电话：），我们将在第一时间协商版权问题或删除内容！内容为作者个人观点，并不代表本公众号赞同其观点和对其真实性负责。点击下方“阅读原文”查看更多
本文来自微信公众账号提交，由微信啦收录，转载请注明出处。
微信扫码分享文章11510人阅读
& & & &&如今语音识别在PC机和智能手机上炒的火热，ROS走在技术的最前沿当然也不会错过这么帅的技术。ROS中使用了CMU Sphinx和Festival开源项目中的代码，发布了独立的语音识别包，而且可以将识别出来的语音转换成文字，然后让机器人智能处理后说话。
一、语音识别包
& & & &&安装很简单，直接使用ubuntu命令即可，首先安装依赖库：$ sudo apt-get install gstreamer0.10-pocketsphinx
$ sudo apt-get install ros-fuerte-audio-common
$ sudo apt-get install libasound2
& & & &&然后来安装ROS包：$ svn checkout http://albany-ros-/svn/trunk/rharmony
$ rosmake pocketsphinx
& & & &&其中的核心文件就是nodes文件夹下的recognizer.py文件了。这个文件通过麦克风收集语音信息，然后调用语音识别库进行识别生成文本信息，通过/recognizer/output消息发布，其他节点就可以订阅该消息然后进行相应的处理了。
& & & & 安装完成后我们就可以运行测试了。
& & & & 首先，插入你的麦克风设备，然后在系统设置里测试麦克风是否有语音输入。
& & & & 然后，运行包中的测试程序： & & & &$ roslaunch pocketsphinx robocup.launch
& & & &&此时，在终端中会看到一大段的信息。尝试说一些简单的语句，当然，必须是英语，例如：bring me the glass，come with me，看看能不能识别出来。
& & & &《ros by example》这本书中写得测试还是很准确的，但是我在测试中感觉识别相当不准确，可能是我的英语太差了吧。
& & & &&我们也可以直接看ROS最后发布的结果消息：$ rostopic echo /recognizer/output
二、语音库
1、查看语音库
& & & &&这个语音识别时一种离线识别的方法，将一些常用的词汇放到一个文件中，作为识别的文本库，然后分段识别语音信号，最后在库中搜索对应的文本信息。如果想看语音识别库中有哪些文本信息，可以通过下面的指令进行查询：$ roscd pocketsphinx/demo
$ more robocup.corpus
2、添加语音库
& & & &&我们可以自己向语音库中添加其他的文本识别信息，《ros by example》自带的例程中是带有语音识别的例程的，而且有添加语音库的例子。
& & & & 首先看看例子中要添加的文本信息：$ roscd rbx1_speech/config
$ more nav_commands.txt
& & & &&这就是需要添加的文本，我们也可以修改其中的某些文本，改成自己需要的。
& & & & 然后我们要把这个文件在线生成语音信息和库文件，这一步需要登陆网站http://www.speech.cs.cmu.edu/tools/lmtool-new.html，根据网站的提示上传文件，然后在线编译生成库文件。
& & & &&把下载的文件都解压放在rbx1_speech包的config文件夹下。我们可以给这些文件改个名字：$ roscd rbx1_speech/config
$ rename -f 's/3026/nav_commands/' *
& & & &&在rbx1_speech/launch文件夹下看看voice_nav_commands.launch这个文件：&launch&
&node name=&recognizer& pkg=&pocketsphinx& type=&recognizer.py&
output=&screen&&
&param name=&lm& value=&$(find rbx1_speech)/config/nav_commands.lm&/&
&param name=&dict& value=&$(find rbx1_speech)/config/nav_commands.dic&/&
& & & &&可以看到，这个launch文件在运行recognizer.py节点的时候使用了我们生成的语音识别库和文件参数，这样就可以实用我们自己的语音库来进行语音识别了。
& & & & 通过之前的命令来测试一下效果如何吧：$ roslaunch rbx1_speech voice_nav_commands.launch
$ rostopic echo /recognizer/output
三、语音控制
& & & &&有了语音识别，我们就可以来做很多犀利的应用了，首先先来尝试一下用语音来控制机器人动作。
1、机器人控制节点
& & & &&前面说到的recognizer.py会将最后识别的文本信息通过消息发布，那么我们来编写一个机器人控制节点接收这个消息，进行相应的控制即可。
& & & & 在pocketsphinx包中本身有一个语音控制发布Twist消息的例程voice_cmd_vel.py，rbx1_speech包对其进行了一些简化修改，在nodes文件夹里可以查看voice_nav.py文件：#!/usr/bin/env python
voice_nav.py
Allows controlling a mobile base using simple speech commands.
Based on the voice_cmd_vel.py script by Michael Ferguson in
the pocketsphinx ROS package.
See http://www.ros.org/wiki/pocketsphinx
roslib.load_manifest('rbx1_speech')
import rospy
from geometry_msgs.msg import Twist
from std_msgs.msg import String
from math import copysign
class VoiceNav:
def __init__(self):
rospy.init_node('voice_nav')
rospy.on_shutdown(self.cleanup)
# Set a number of parameters affecting the robot's speed
self.max_speed = rospy.get_param(&~max_speed&, 0.4)
self.max_angular_speed = rospy.get_param(&~max_angular_speed&, 1.5)
self.speed = rospy.get_param(&~start_speed&, 0.1)
self.angular_speed = rospy.get_param(&~start_angular_speed&, 0.5)
self.linear_increment = rospy.get_param(&~linear_increment&, 0.05)
self.angular_increment = rospy.get_param(&~angular_increment&, 0.4)
# We don't have to run the script very fast
self.rate = rospy.get_param(&~rate&, 5)
r = rospy.Rate(self.rate)
# A flag to determine whether or not voice control is paused
self.paused = False
# Initialize the Twist message we will publish.
self.cmd_vel = Twist()
# Publish the Twist message to the cmd_vel topic
self.cmd_vel_pub = rospy.Publisher('cmd_vel', Twist)
# Subscribe to the /recognizer/output topic to receive voice commands.
rospy.Subscriber('/recognizer/output', String, self.speech_callback)
# A mapping from keywords or phrases to commands
self.keywords_to_command = {'stop': ['stop', 'halt', 'abort', 'kill', 'panic', 'off', 'freeze', 'shut down', 'turn off', 'help', 'help me'],
'slower': ['slow down', 'slower'],
'faster': ['speed up', 'faster'],
'forward': ['forward', 'ahead', 'straight'],
'backward': ['back', 'backward', 'back up'],
'rotate left': ['rotate left'],
'rotate right': ['rotate right'],
'turn left': ['turn left'],
'turn right': ['turn right'],
'quarter': ['quarter speed'],
'half': ['half speed'],
'full': ['full speed'],
'pause': ['pause speech'],
'continue': ['continue speech']}
rospy.loginfo(&Ready to receive voice commands&)
# We have to keep publishing the cmd_vel message if we want the robot to keep moving.
while not rospy.is_shutdown():
self.cmd_vel_pub.publish(self.cmd_vel)
def get_command(self, data):
# Attempt to match the recognized word or phrase to the
# keywords_to_command dictionary and return the appropriate
for (command, keywords) in self.keywords_to_command.iteritems():
for word in keywords:
if data.find(word) & -1:
return command
def speech_callback(self, msg):
# Get the motion command from the recognized phrase
command = self.get_command(msg.data)
# Log the command to the screen
rospy.loginfo(&Command: & + str(command))
# If the user has asked to pause/continue voice control,
# set the flag accordingly
if command == 'pause':
self.paused = True
elif command == 'continue':
self.paused = False
# If voice control is paused, simply return without
# performing any action
if self.paused:
# The list of if-then statements should be fairly
# self-explanatory
if command == 'forward':
self.cmd_vel.linear.x = self.speed
self.cmd_vel.angular.z = 0
elif command == 'rotate left':
self.cmd_vel.linear.x = 0
self.cmd_vel.angular.z = self.angular_speed
elif command == 'rotate right':
self.cmd_vel.linear.x = 0
self.cmd_vel.angular.z = -self.angular_speed
elif command == 'turn left':
if self.cmd_vel.linear.x != 0:
self.cmd_vel.angular.z += self.angular_increment
self.cmd_vel.angular.z = self.angular_speed
elif command == 'turn right':
if self.cmd_vel.linear.x != 0:
self.cmd_vel.angular.z -= self.angular_increment
self.cmd_vel.angular.z = -self.angular_speed
elif command == 'backward':
self.cmd_vel.linear.x = -self.speed
self.cmd_vel.angular.z = 0
elif command == 'stop':
# Stop the robot!
Publish a Twist message consisting of all zeros.
self.cmd_vel = Twist()
elif command == 'faster':
self.speed += self.linear_increment
self.angular_speed += self.angular_increment
if self.cmd_vel.linear.x != 0:
self.cmd_vel.linear.x += copysign(self.linear_increment, self.cmd_vel.linear.x)
if self.cmd_vel.angular.z != 0:
self.cmd_vel.angular.z += copysign(self.angular_increment, self.cmd_vel.angular.z)
elif command == 'slower':
self.speed -= self.linear_increment
self.angular_speed -= self.angular_increment
if self.cmd_vel.linear.x != 0:
self.cmd_vel.linear.x -= copysign(self.linear_increment, self.cmd_vel.linear.x)
if self.cmd_vel.angular.z != 0:
self.cmd_vel.angular.z -= copysign(self.angular_increment, self.cmd_vel.angular.z)
elif command in ['quarter', 'half', 'full']:
if command == 'quarter':
self.speed = copysign(self.max_speed / 4, self.speed)
elif command == 'half':
self.speed = copysign(self.max_speed / 2, self.speed)
elif command == 'full':
self.speed = copysign(self.max_speed, self.speed)
if self.cmd_vel.linear.x != 0:
self.cmd_vel.linear.x = copysign(self.speed, self.cmd_vel.linear.x)
if self.cmd_vel.angular.z != 0:
self.cmd_vel.angular.z = copysign(self.angular_speed, self.cmd_vel.angular.z)
self.cmd_vel.linear.x = min(self.max_speed, max(-self.max_speed, self.cmd_vel.linear.x))
self.cmd_vel.angular.z = min(self.max_angular_speed, max(-self.max_angular_speed, self.cmd_vel.angular.z))
def cleanup(self):
# When shutting down be sure to stop the robot!
twist = Twist()
self.cmd_vel_pub.publish(twist)
rospy.sleep(1)
if __name__==&__main__&:
VoiceNav()
rospy.spin()
except rospy.ROSInterruptException:
rospy.loginfo(&Voice navigation terminated.&)
& & & &&可以看到，代码中定义了接收到各种命令时的控制策略。
2、仿真测试
& & & &&和前面一样，我们在rviz中进行仿真测试。
& & & & 首先是运行一个机器人模型：$ roslaunch rbx1_bringup fake_turtlebot.launch
& & & &&然后打开rviz：$ rosrun rviz rviz -d `rospack find rbx1_nav`/sim_fuerte.vcg
& & & & 如果不喜欢在终端里看输出，可以打开gui界面：$ rxconsole
& & & &&再打开语音识别的节点：$ roslaunch rbx1_speech voice_nav_commands.launch
& & & &&最后就是机器人的控制节点了：$ roslaunch rbx1_speech turtlebot_voice_nav.launch
& & & &OK，打开上面这一堆的节点之后，就可以开始了。可以使用的命令如下：
& & & & 下图是我的测试结果，不过感觉准确度还是欠佳：
四、播放语音
& & & &&现在机器人已经可以按照我们说的话行动了，要是机器人可以和我们对话就更好了。ROS中已经集成了这样的包，下面就来尝试一下。
& & & & 运行下面的命令：$ rosrun sound_play soundplay_node.py
$ rosrun sound_play say.py &Greetings Humans. Take me to your leader.&
& & & &&有没有听见声音！ROS通过识别我们输入的文本，让机器人读了出来。发出这个声音的人叫做kal_diphone，如果不喜欢，我们也可以换一个人来读：$ sudo apt-get install festvox-don
$ rosrun sound_play say.py &Welcome to the future& voice_don_diphone
& & & &哈哈，这回换了一个人吧，好吧，这不也是我们的重点。
& & & &在rbx1_speech/nodes文件夹中有一个让机器人说话的节点talkback.py:#!/usr/bin/env python
talkback.py - Version 0.1
Use the sound_play client to say back what is heard by the pocketsphinx recognizer.
Created for the Pi Robot Project: http://www.pirobot.org
Copyright (c) 2012 Patrick Goebel.
All rights reserved.
This prog you can redistribute it and/or modify
it under the terms of the GNU General Public License as published by
the Free Software F either version 2 of the License, or
(at your option) any later version.5
This program is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
GNU General Public License for more details at:
http://www.gnu.org/licenses/gpl.htmlPoint
roslib.load_manifest('rbx1_speech')
import rospy
from std_msgs.msg import String
from sound_play.libsoundplay import SoundClient
import sys
class TalkBack:
def __init__(self, script_path):
rospy.init_node('talkback')
rospy.on_shutdown(self.cleanup)
# Set the default TTS voice to use
self.voice = rospy.get_param(&~voice&, &voice_don_diphone&)
# Set the wave file path if used
self.wavepath = rospy.get_param(&~wavepath&, script_path + &/../sounds&)
# Create the sound client object
self.soundhandle = SoundClient()
# Wait a moment to let the client connect to the
# sound_play server
rospy.sleep(1)
# Make sure any lingering sound_play processes are stopped.
self.soundhandle.stopAll()
# Announce that we are ready for input
self.soundhandle.playWave(self.wavepath + &/R2D2a.wav&)
rospy.sleep(1)
self.soundhandle.say(&Ready&, self.voice)
rospy.loginfo(&Say one of the navigation commands...&)
# Subscribe to the recognizer output and set the callback function
rospy.Subscriber('/recognizer/output', String, self.talkback)
def talkback(self, msg):
# Print the recognized words on the screen
rospy.loginfo(msg.data)
# Speak the recognized words in the selected voice
self.soundhandle.say(msg.data, self.voice)
# Uncomment to play one of the built-in sounds
#rospy.sleep(2)
#self.soundhandle.play(5)
# Uncomment to play a wave file
#rospy.sleep(2)
#self.soundhandle.playWave(self.wavepath + &/R2D2a.wav&)
def cleanup(self):
self.soundhandle.stopAll()
rospy.loginfo(&Shutting down talkback node...&)
if __name__==&__main__&:
TalkBack(sys.path[0])
rospy.spin()
except rospy.ROSInterruptException:
rospy.loginfo(&Talkback node terminated.&)
& & & & &我们来运行看一下效果：$ roslaunch rbx1_speech talkback.launch
& & & & &然后再说话，ROS不仅将文本信息识别出来了，而且还读了出来，厉害吧。当然了，现在还没有加入什么人工智能的算法，不能让机器人和我们聪明的说话，不过这算是基础了，以后有时间再研究一下人工智能就更犀利了。
----------------------------------------------------------------
欢迎大家转载我的文章。
转载请注明：转自古-月
欢迎继续关注我的博客
参考知识库
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：800831次
积分：8072
积分：8072
排名：第1731名
原创：79篇
转载：47篇
评论：600条
文章：25篇
阅读：302955

有没有将ros，语音，ros 人脸识别，导航融合在一起的平台

我要回帖

更多关于人脸融合的文章

随机推荐

有没有将ros，语音，ros 人脸识别，导航融合在一起的平台

我要回帖

更多关于 人脸融合 的文章

随机推荐

更多关于人脸融合的文章