如何选择Microsoft Azure机器学习算法

TECH2IPO/创见
「 新生活 新科技 新零售」
微软正式发布Azure机器学习平台
你是否清楚通过用户、社交网络以及互联网流入你的公司的大数据?微软希望帮你处理这些数据,建立API并在云端利用机器学习技术让这些数据真正地为你所用。
你是否清楚所有那些通过传感器,用户,社交网络,Excel 表格以及互联网流入你的公司的大数据?微软希望帮助你处理所有这些数据,建立 API(应用程序接口)并在云端利用机器学习技术让这些数据真正地为你所用。而为了达到这一目标,微软在今天的大数据行业大会 (Strata Conference) 上正式宣布开始为所有用户提供用于在云端处理大数据的 Azure 机器学习服务。微软同时还发布了一些更新,这些更新使 Azure 机器学习平台的功能相对于六月份所发布的 Beta 版有不少提高。正如我们在去年六月份所写道的,「这款产品基于其机器学习功能,这一功能已被应用于 Xbox 和必应等微软现有的一些产品,它为用户提供预定义模板和工作流,因此,相对于传统的开发手段,它能帮助用户更快地开发出预测类应用。此外,用户还可以在 Azure 机器学习平台上发布 API 和网络服务」。Joseph Sirosh 是负责 Azure 机器学习项目的微软公司副总裁,他在加入微软并接手这个项目之前还曾在 Amazon 工作过几年。他说道,最新版本目前还支持 Python,而不仅仅是较为流行的 R。「我们增加了对于 Python 的支持,它受到许多数据科学家的青睐,而且 Python 还拥有一个庞大的生态系统」,Sirosh 告诉 Techcrunch。他说,这一功能将会为数据科学家带来强大的能力。「我们做了许多改进,而增加对 Python 的支持则是其中重要的一部分。Azure 机器学习是一个平台。你可以复制一段 Python 源代码,然后将其嵌入 ML studio 并创建一个 API」,他解释道。另外,Azure 机器学习平台现在也支持 Hadoop 和 Spark,不论你选择哪个平台,它都将为你提供一组极为全面的工具集以便处理大数据。Azure 机器学习平台真正的强大之处在于它能够创建 API 并迅速开始数据处理过程。正如我们在去年六月份所写道的那样,「『云计算解决了最后一英里的问题』,Sirosh 解释道。在此类服务出现之前,你需要让数据科学家确定数据集,之后让 IT 部门开发相应的应用以便提供支持。对于那些规模较大的项目,完成最后一步往往需要数周甚至数月的时间。他说,而 Azure 机器学习平台则简化了这一过程,它为我们提供了一种全新的方式,使开发者能够在几小时内开发出相同的应用」。Sirosh 在描述 Azure 机器学习平台所能为我们提供的选择范围时显得十分兴奋。「数据科学家可以仅仅通过几次点击便完成发布 API 的过程。应用可以嵌入 R 代码,Python 代码 (或两者兼而有之)。这是一个多么惊人的能力啊」,Sirosh 说道。他说,尽管我们的竞争对手,如 IBM 和 SAS 同样提供了一系列服务,但它们都无法像 Azure 机器学习平台那样,以一个高度集成的方式为用户提供服务。「这是一个高度组织化的集成工具集」,他说道,「你完全不需要安装任何软件或硬件设备,与此同时,你却可以使用高级的学习和分析功能」。除了在云端提供用于处理大数据的工具之外,微软还提供了一个商店,以便开发者们分享他们所开发的应用和 API。Sirosh 说,这是一个非常好的能够让数据科学家们公开地验证他们的想法的方式。这个商店目前拥有 20 多个初始试验品,但 Sirosh 认为它拥有极其巨大的潜力。他相信未来绝大部分的公司都能够通过在这个商店里找到正确的工具来满足他们的大数据处理需求。「当 Azure 机器学习服务来临时,它将会如此地易于使用,创建一个 API 的成本又是如此地低,对于数据科学家和开发者们来说,在云端创建机器学习 API 将变得十分简单」,他说道。在数据可视化方面,Azure 机器学习平台也内置了一些功能,但它同时也与 Microsoft Power BI 和 IPython Notebook 兼容,以便进一步绘制图像或可视化处理完成的数据。
请后参与评论从 Azure Machine Learning 开始进入机器学习-技术博客-@大数据资讯
你好,游客
从 Azure Machine Learning 开始进入机器学习
来源:中国大数据&
作者:開發者之魂
  什么是机器学习?
  Machine Learning(机器学习)不是什么新技术,至少我在十几年前(远目)在大学时修这门课是就已经是发展一段时间的领域,而用最简单的说法来解释「机器学习」,就是让机器拥有学习能力,能够建立自己的「智慧」,进而在真实世界中进行推论(预测)、分类或是分群等动作,当然,就像我们人类学习一样,要嘛是读书破万卷,要嘛是从师长口中、生活当中得到经验,然后把这些内容、经验归纳出自己的智慧,机器要学习也需要大量的资料才能进行学习,而之所以最近会成为一个热门的话题,自然也是因为资通讯的发达后,人们开始想从大量资料(Big Data)中找出商业智慧或是利用这些资产来建立智慧,于是争相开始讨论机器学习。
  具体来说,到底机器学习的是什么呢?科学家们将学习的模型分成几种类型,以上图为例,它是一种学习「分类」(classification) 的问题,透过合适的学习方法(学习演算法)建立起来的模型,就像图中的虚线一样,能够判断哪些资料是哪一个类别。以现实生活来举例,邮件伺服器可以透过机器学习来学会判断一封信是否为垃圾邮件,学习的资料就是过往大量的邮件,以及导师(例如你手动标记哪些信是垃圾信)标记哪些信是垃圾信,让邮件伺服器愈来愈有能力主动地判断一封新信件是否为垃圾邮件,这就是机器学习的应用之一。所以我们可以知道,机器学习是让机器(当然包含软体)有能力对于未来的事物或情境採取行动的方式。
  Azure Machine Learning
  Azure machine learning overview from Lin-Chieh Shangkuan
  Azure 机器学习(Azure ML)是 Microsoft Azure 平台上其中一个服务,这个服务为想要进行机器学习的开发团队,提供了处理的基础建设、机器学习的演算法、硬体运算资源、以及将模型变成 Web Service 等服务,让开发团队可以专注在资料的蒐集、要解决的问题、判断要「学习」什么问题,其它运算的工作就让 Azure 机器学习这个平台来完成。在这个服务下,不管你的资料放在哪裡(放在 Azure 上或不在 Azure 上),都可以拉进 Azure ML 来进行学习的工作,这裡我们以实际的操作来做说明。
  上图是 Azure Machine Learning Studio 的首页,可以看到一些影片介绍,如果想要立刻免费体验 Azure ML(是的,有免费方案),可以点右上角的 Sign In 连结,使用 Microsoft 帐号(也就是之前的 Windows Live ID、MSN 帐号等)登入,就会进入 Azure ML Studio 的操作画面(或是你要称它为实验室也可以):
  在这个 Studio 中,Machine Learning 的操作都是称作「实验」(experiments),你可以在一个实验裡训练一个或多个模型。
  进入实验的操作画面,你可以看到中间的区域可以让你排列组织资料流的动线,还有要使用的资料操作、演算法、验证模型等等,而这些区块都是从左侧的面板拖拉进来的,像是选择适用的学习演算法:
  这样就可以把 Bayesian Linear Regression 的演算法拉进来,再与其它的资料操作流程来连接。而右边的面板就是针对不同的区块进行设定:
  在训练模型之前,你可能会想到先整理一下资料(data cleansing),像是删掉一些不用的栏位、或是只拿其中几个栏位来进行学习,这些都可以在 Azure ML Studio 中拖拉操作,如果有必要的话,也可以套入 R script 来自己写 code 处理:
  除了可以处理资料之中,训练模型也可以使用由微软研究院研发多年的演算法模组来使用,你只要调整这些演算法的参数即可,如同这个例子想要做「预测」的学习,就可以直接套用 Regression 类的演算法,这裡我选了用 Linear Regression。
  而训练好的模型也不是只有在实验室裡可以玩而已,可以直接设定 input/output 后,发佈成 Web Service:
  看到这裡你也想玩一下 Azure ML 了吗?如同前面提到的,现在可以免费体验 Azure ML,而 Azure 官方网站也提供了一些 Lab 让你感受一下 Machine Learning 以及 Azure ML 提供的模组,可以到这裡试试看!
  常见问题
  Q: Machine Learning 很神吗?
  A: 机器学习其实跟我们人类学习一样,你餵给它什么资料它就学什么,学习资料够不够多、学习方法(学习演算法)好不好、是否有抓到重点(选择训练的资料栏位)等等都会影响学习的成果,机器学习只是可以大量、快速学习,不代表它就一定会完全正确喔。
  Q: 用 Azure ML 需要事先安装软体吗?还是限定作业系统呢?
  A: Azure ML Studio 是一个完全以 HTML 技术开发的平台,只要在浏览器中就可以操作。
  Q: 我的资料一定要放在 Azure 上才能学习吗?
  A: 在 Azure ML Studio 中的 Data Reader 或 Hive Query 都可以让您从各个地方将资料透过 HTTP 匯入,并不限制一定得放在 Azure 上。不过 Azure HDInsight、Azure SQL Database 或是 Azure Storage 都很适合处理大数据,也很方便整合。
相关新闻 & & &
& (10月13日)
& (09月11日)
& (10月19日)
& (09月11日)
   同意评论声明
   发表
尊重网上道德,遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
如何选择机器学习项目的算法
下载积分:3000
内容提示:如何选择机器学习项目的算法
文档格式:PPT|
浏览次数:0|
上传日期: 05:40:20|
文档星级:
全文阅读已结束,如果下载本文需要使用
 3000 积分
下载此文档
该用户还上传了这些文档
如何选择机器学习项目的算法
关注微信公众号微软或推出新服务:用机器学习技术预测未来|Azure|机器学习|微软_业界_新浪科技_新浪网
微软或推出新服务:用机器学习技术预测未来
  新浪科技讯 北京时间6月17日下午消息,称将推出一项名为Azure机器学习的服务,旨在将机器学习技术进行更广泛的应用。
  微软副总裁兼企业在线服务市场部高级主管Eron Kelly在谈微软Azure机器学习服务时表示:“我们希望能向更多人群推广机器学习。企业主和营销团队真心希望能够借助数据来超越竞争对手,但是数据量越来越大,企业很难进行彻底筛选。”
  作为人工智能的一个分支,机器学习技术借助算法让电脑对大量流动数据集进行识别。这种方式能够通过历史数据来预测未来事件和行为,明显优于传统的商业智能形式。
  经过几十年的学术研究,机器学习已经适用于信用卡欺诈检测等商业用途。微软采用该技术对其个人手机语音助手Cortana进行优化,同时还用来规划在继续建立Azure云计算方面需要多少硬件。
  微软的目标是简化使用机器学习的过程,以便于开发人员、业务分析师和数据科学家进行广泛、便捷地应用。Kelly表示,这款服务的目的在于“将机器学习动力与云计算的简单性相结合”。
  通常,工业级的机器学习需要大量服务器,以及大量关于如何应用、执行机器学习算法的相关专业知识。
  作为一项服务,Azure机器学习让用户不必再担心硬件问题。同时,该公司也致力于简化机器学习算法和相关工具部署的过程。
  该服务具有一项被称为机器学习工作室的接口。控制板包括一些最常用的机器学习算法的可视化图标,用户可以直观地拖放控制板上的可视化图标到一个直观的工作流中。
  该工作室还可以用来建立和修整新的分析模型。开发人员可以用R编程语言编写和分享他们自己的算法。此外,工作室配备了一套共同学习模式的模版。
  Kelly表示,“你可以对历史数据进行修整、调配和优化,然后可以得出完美的输出结果。”很多机器学习项目试用过各种算法模型,以找到最精确的预测结果。
  一旦一个分析模型完成,可以使用微软提供的一套可视化控件在Azure服务网站上进行发布。用户然后可以通过一个应用程序编程接口提供实时数据,并把结果返回给内部部署系统,或者直接返给Azure托管服务或其它云服务。
  该服务还将为那些希望从Azure机器学习技术中建立自己的服务和应用的集成商及第三方软件开发商提供一个软件开发工具包。
  过去一年,Azure机器学习技术与选中的客户一道,一直处于内部测试阶段。随着微软Max 451系统的建立,一个大型零售企业已经使用该服务对其个别客户接下来的购买喜好进行了预测。
  位于匹兹堡的卡内基梅隆大学与应用提供商OSIsoft公司一起运用该服务来研究其校园建筑的能源使用,同时进行断电监控。
  微软还未最终确定Azure机器学习的最终定价,同时完全投入商业化应用的日期也未公布。(商鹊)
&&|&&&&|&&&&|&&
您可通过新浪首页顶部 “”, 查看所有收藏过的文章。
,推荐效果更好!
看过本文的人还看过

我要回帖

 

随机推荐