sklearn xgboostt能接受nan的输入吗

XGBoost与深学到底孰优孰劣?都说XGBoost好用,为什么名气总不如深度上?
来源:Quora整理:AI100本文长度为1600字,建议看3分钟本文分析XGBoost与深度上的差异,分享XGBoost的使。AlphaGo大战柯洁、李世石后,所有人都能谈上几句深度上。人工智能在围棋上的这场突破,最终还要归功于机器上三巨头三十年如一日的长久研究。相比之下,横扫Kaggle大赛的XGBoost(去年的29个获奖方案中,有17个是用XGBoost),名气可就小太多了。更何况,它的倡导者还只是个名不见经传的青年人。有人敢说,XGBoost要比深度上更要,这一点毫无疑问。因为它好用,在很多情况下都进一步可靠、灵活,而且规范;在大多数的回归和分类问题上,XGBoost的其实表现都是最佳的。当然,不买账的人也不少。某Quora撰文写到,针对准确度要求很高的那些问题,XGBoost确实很有优势,同时它的算计特性也很正确。然而,相对于支持向量机、随机森林或深度上,XGBoost的优势倒也没到那种夸张的水平。特别是当你有着十足的训数据,并能找到确切的深度神经网络时,深度上的效应就明摆着能好上一大截。还有用户打趣说,XGBoost的声坏在它的名上,深度上一听就异常高大上,XGBoost再怎么包装也是书痴气十足。那么,XGBoost的发起人又是怎么说的呢?XGBoost的发起人——陈天奇博士,他并不确认将深度上和XGBoost截然对立起来。他谈到,这两种方式在其个别擅长领域的习性表现都大好:XGBoost专注于模型的可解释性,而根据人工神经网络的深度上,则更关爱模型的准确度。?XGBoost更适用于变量数较少的表格数据,而深学则更适用于图像或其他有雅量变量的数码。到底,XGBoost与深学孰优孰劣?陈天奇在Quora上的解答如下:不同的机学习型适用于不同门类的天职。深度神经网络通过对时空位置建模,能够很好地破获图像、语音、文本等高维数据。而根据树模型的XGBoost则能很好地处理表格数据,同时还装有一些深神经网络所未曾的风味(如:模型的可解释性、输入数据的静止性、更便于调参等)。这两类模型都很要紧,并大面积用于数据正确竞赛和工业界。举例来说,几乎所有应用机器上技术的铺都在利用tree boosting,同时XGBoost已经给业界带来了很大的震慑。作为一名机器上研究者,我直接在用深度上和XGBoost。我信任,我们需要到知道每一种模型,并能选出最符合你手上任务的好。XGBoost、深度神经网络与其他时不时要用的机械学习算法(如因子分解机、logistic回归分析等),值得机器上行业的每一位从业者关注。这里没一药能解百病的传道。既然涉及XGBoost在业界已有广大的下,那么究竟又有哪些呢?XGBoost实际用例不完全列表dmlc/xgboost(/dmlc/xgboost/tree/master/demo#usecases)使用XGBoost的Kaggle获奖方案可在此地找到:/kernels?使用XGBoost的Seldon预测服务Irishttp://docs.seldon.io/iris-demo.html?XGBoost的遍布式版本被用于阿里云大数据测算服务ODPS /articles/6355?使用XGBoost的Graphlab Create腾讯数据平台把分布式版本的XGBoost用于微信内的贾点击预测汽车之家把分布式版本的XGBoost用于展示广告的点击率预计谈了XGBoost的下范围,再来客观聊聊XGBoost的特性。
分享这篇日志的人也喜欢
新人求破十万
萌香香又回来了?
热门日志推荐
人人最热标签
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&
请输入手机号,完成注册
请输入验证码
密码必须由6-20个字符组成
下载人人客户端
品评校花校草,体验校园广场训练XGBoost的一些脚本,
编辑:www.fx114.net
本篇文章主要介绍了"训练XGBoost的一些脚本,",主要涉及到训练XGBoost的一些脚本,方面的内容,对于训练XGBoost的一些脚本,感兴趣的同学可以参考一下。
/happycube/bosch-production-line-performance/scirpus-extreme-bayes-faron-36312/code
说明:这个脚本是训练XGBoost的脚本,值得去学习,特别是XGBoost的一些参数设置
[python]&&
值得学习的几个点:
1、自定义评价函数
2、使用early_stop来防止过拟合
3、train,test数据的生成方式简洁
4、对于同一个模型,跑n-fold取平均。
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家社会集体的和公民的合法权益,不得利用本站制作、复制和传播不法有害信息!
二、互相尊重,对自己的言论和行为负责。
本文标题:
本页链接:有人使用过xgboost吗? - 知乎173被浏览34719分享邀请回答114 条评论分享收藏感谢收起5添加评论分享收藏感谢收起查看更多回答结构化数据上的机器学习大杀器XGBoost
你好,游客
结构化数据上的机器学习大杀器XGBoost
来源:极客头条&
  GBoost是一个机器学习算法工具,它的原理本身就并不难理解,而且你并不需要彻底搞懂背后的原理就能把它用得呼呼生风。
  它的威力有多强?
  自从2014年9月份在 Kaggle 的希格斯玻色子机器学习大赛中夺魁以来,XGBoost 与深度学习两个算法垄断了 Kaggle 大赛的大部分冠军。
  现在 Kaggle 大赛的情况基本是这样的,凡是非结构化数据相关,比如语音、图像,基本都是深度学习获胜,凡是结构化数据上的竞赛,基本都是 XGBoost 获胜。要知道大部分的业务数据,都是以良好格式存储在关系数据库中的结构化数据,这也就是说,跟行业应用、业务优化这些真金白银息息相关的场景里,XGBoost是目前最好用的大杀器之一。
  如果时间倒退两年,在2015年,只要你用 XGBoost 算法参赛,不用做特别优化,在很多结构化数据科学竞赛中就排到前十。尤其是 2015 年下半年,XGBoost 横扫 Kaggle 大赛,冠军拿到手软。
  看看这些冠军们怎么评价 XGBoost
  2015年7月 Avito 上下文广告点击大赛冠军 Owen Zhang 说:&要是你犹豫不决,不知如何是好,就放 XGBoost 出来咬。&
  2015年8月卡特彼勒钢管价格预测大赛冠军四人组说:&XGBoost是我们手上& 最牛的单一模型算法。&
  2015年8月物业检查预测大赛冠军Qingchen Wang 说:&我只用 XGBoost&。
  2015年9月优惠券销售预测大赛冠军 Halla Yang 说:&在监督学习算法中我只使用 Gradient Boosting,而在 Gradient Boosting 算法的实现中我只使用 XGBoost。&
  2015年10月 True Native 大赛冠军 Mad Professor 说:&我已经拿了好几个Kaggle竞赛冠军了,你们可以相信我的话,XGBoost真的是个牛逼的全能算法,你值得拥有。&
  但比较奇怪的是,然而只要离开这个小小的圈子,在广大的数据科学的蛮荒之地,绝大多数人都只知有深度学习,而不知有 XGBoost。我想大概可以归结为两方面原因。
  第一是公众的注意力集中在人工智能下围棋、机器人、识别人脸、自动驾驶这些性感的应用场景里,对于专业领域内的应用,即便大脑知道它们很重要、很有价值,但小脑提不起兴趣。
  但这种态度不科学啊!要知道深度学习虽然具有革命性,但是你去看看 Kaggle 上来自真实需求的那些竞赛课题,会发现大多数还是结构化行业数据的分析。预测客户的回头率啊,预测产品寿命,预测病人是否爽约,分析干系人是否有作案嫌疑,计算产品在各城市最佳的铺货分布,等等。这些项目背后是各行各业对 AI 的迫切而真实的需求,是几千上万亿美元的潜在市场。而这正是 XGBoost 这一类算法可以驰骋的舞台,所以我们当然应该关注。
  第二是网上现有的 XGBoost 文章,差不多都是给正在学习机器学习的人准备的&课外读物&,它假设你已经花很长时间复习了数学基础,正在学习20个机器学习算法,而 Gradient Boosting 只是其中之一,XGBoost 只是工具之一。如果你不是这种情况,那就很难看懂这些文章。
  但其实使用 XGBoost 也不需要掌握那么多其他算法啊,也不需要自底向上一层一层的积累啊。跟学习深度学习类似,如果你的目标就是掌握这一两个大杀器,那你完全可以单刀直入,在比较短的时间里形成单点突破。这是今天学习和使用 AI 技术的一个可行的途径。甚至对于有经验的开发者来说,这是一个更优的选择。
  XGBoost 该红不红,其实受损失的最终还是用户和学习者。所以我们觉得应该把 XGBoost 这个算法单独抽出来,从基础的原理到算法分析,从工具使用到工程经验,来一个单点突破。
  能够讲这个单点突破课程的人不多。我们邀请到有多年一线机器学习教学经验的中科院专家,精心剪裁出一个 XGBoost 核心突破课程&&《XGBoost从基础到实战》。课程传送门:.cn/course/57
  课程目标是能够在10个小时之内使你达到能动手开发模型的程度。如果你在学习机器学习,那这个课程能够帮助你纵向掌握 XGBoost 及其所有相关基础知识,在你武器库里添加一个大杀器。
  如果你急于用机器学习来解决工作中的一个问题,又没有很多时间完整学习,那么请考虑 XGBoost 吧。也许很多高手学了一大圈之后,发现最后还是 XGBoost 好用。
相关新闻 & & &
尊重网上道德,遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款

我要回帖

更多关于 xgboost 输入格式 的文章

 

随机推荐