想求一下mkmk52普的配布密码提示!

求roco大大APH的MMD模型配布地址_百度知道
求roco大大APH的MMD模型配布地址
呜啊……想下几个APH模型但是找不大roco大大的配布地址…………
您的回答被采纳后将获得:
系统奖励15(财富值+成长值)+难题奖励20(财富值+成长值)
我有更好的答案
这儿就是了...除了军服露/子露/军服耀/爱沙/阿嫁/阿冰/诺子/西君/独娘/普娘/荷哥/万圣荷哥/牛仔米/若法/北区的杯子以外全部限定orz没社区/限配的模简介应该都写番号了,动画简介里应该就有密码.roco太太的Dover(特别是法)是我学日语的一大动力_(:з」∠)_才发现是15年的!!!∑(゚Д゚ノ)ノ我错了qaq
roco的b碗主页。有些模型是社区模型,但是有些还是可以下载的
niconico的sm号?
为您推荐:
其他类似问题
芭比布朗的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。&figure&&img src=&https://pic4.zhimg.com/v2-c8bcaa4ce5ade_b.jpg& data-rawwidth=&900& data-rawheight=&500& class=&origin_image zh-lightbox-thumb& width=&900& data-original=&https://pic4.zhimg.com/v2-c8bcaa4ce5ade_r.jpg&&&/figure&&p&关注人类进化史的朋友们都知道,我们的祖先智人是个风流的物种。他们跟古人类尼安德特人啪啪啪出混血的我们之后,在我们的体内留下了一些「定时炸弹」,例如导致抑郁症、II型糖尿病、吸烟成瘾等,实在是拖了现代智人的后腿。&/p&&p&&br&&/p&&p&不过,智人欠下的风流债可不止这些。除了尼安德特人,他们还跟其他远古人种羞羞过,并且也对我们现代人造成了一些影响。&/p&&p&&br&&/p&&p&2008年,西伯利亚阿尔泰山丹尼索瓦洞穴 (Denisova Cave) 里面,考古人员发现了如下神秘物品:&/p&&figure&&img src=&https://pic2.zhimg.com/v2-4fb006ef1_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&275& data-rawheight=&183& class=&content_image& width=&275&&&/figure&&p&&br&&/p&&p&这不是松子,也不是牙齿,而是……&/p&&p&一个女孩的指骨碎片。&/p&&p&&br&&/p&&p&没错,这期智人观察室,我们走近的就是——丹尼索瓦人(Denisovan)。&/p&&h2&&b&他们是谁?&/b&&/h2&&p&研究人员发现这颗珍贵的指骨碎片后,还发现了包括一块指骨、一颗牙齿和一些饰物在内的化石。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-903e203f1f774cc52b8b_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&800& data-rawheight=&1200& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&https://pic2.zhimg.com/v2-903e203f1f774cc52b8b_r.jpg&&&/figure&&p&利用现存的 DNA 对其进行测序。排除了现代人 DNA 污染等因素后进行了全基因组测序,推测这块指骨的主人可能是一个 5-7 岁的小女孩,研究人员把她标记为“Woman X”&/p&&p&Hmmm…. 怎么想到了Xman。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-7c4d4e3fc34007bcddaa2e7_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&275& data-rawheight=&183& class=&content_image& width=&275&&&/figure&&p&&br&&/p&&p&DNA 证据表明,这小女孩并不属于任何已知古人类物种,于是按照发现地被命名为丹尼索瓦人。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-fbfcfe196e6_b.jpg& data-size=&normal& data-rawwidth=&500& data-rawheight=&375& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&https://pic3.zhimg.com/v2-fbfcfe196e6_r.jpg&&&figcaption&丹尼索瓦洞&/figcaption&&/figure&&p&&br&&/p&&p&比较基因序列差异后科学家们推断,这个人种大概在一百万年前就与我们智人祖先、以及尼安德特人分道扬镳了。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-1c5c049f927d7cdf35a8_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&350& data-rawheight=&237& class=&content_image& width=&350&&&/figure&&p&丹尼索瓦人依靠双脚行走,但身体构造和智人、尼安德特人却有所不同。他们与尼安德特人是姐妹群关系,因此长得也比较相似。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-7dbdad5d14f87c6ca3a8a_b.jpg& data-size=&normal& data-rawwidth=&640& data-rawheight=&426& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-7dbdad5d14f87c6ca3a8a_r.jpg&&&figcaption&尼安德特人复原像&/figcaption&&/figure&&p&2012 年,研究人员完成了对丹尼索瓦人的基因组测序,发现:&/p&&p&现代人类的基因组中还保留了部分丹尼索瓦人的基因。从某种意义上来说,他们还活在我们体内。&/p&&p&而且在部分人群中比例高达 5%,比尼安德特人的还高(非洲以外的人群中,尼安德特人基因比例约为 1%~4%)。&/p&&h2&&b&5 万年前的智人一时风流,给今天的智人留下了苦头&/b&&/h2&&p&今天的一些澳大拉西亚((包括澳大利亚、新西兰和邻近的太平洋群岛),尤其是来自巴布亚新几内亚的人中,约 5% 的DNA来源于丹尼索瓦人。我们的智人祖先在5万年前、甚至更早就与丹尼索瓦人做过羞羞的事了。&/p&&p&&br&&/p&&p&美国华盛顿大学的 Sharon Browning 团队将古代 DNA 分离出来之后,又利用丹尼索瓦人和尼安德特人、现代不同大洲的人群的基因组信息,构建了一个古人与现代人基因交流的模型,发现相比起巴布亚人,&b&东亚人和丹尼索瓦人基因组匹配度更高&/b&。这一分支的丹尼索瓦人与影响巴布亚新几内亚地区人群的丹尼索瓦人分属于两个不同的群体。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-c5baaaec83326ecd0240edff634c379f_b.jpg& data-size=&normal& data-rawwidth=&800& data-rawheight=&531& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&https://pic2.zhimg.com/v2-c5baaaec83326ecd0240edff634c379f_r.jpg&&&figcaption&巴布亚新几内亚人&/figcaption&&/figure&&p&&br&&/p&&p&因此研究人员得出结论:&b&智人在至少两个地方都与丹尼索瓦人发生过为爱鼓掌的故事,包括亚洲东部以及更远的印度尼西亚东南部,或者巴布亚新几内亚。&/b&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-48aeeac59b7e2a744bb774_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&624& data-rawheight=&380& class=&origin_image zh-lightbox-thumb& width=&624& data-original=&https://pic1.zhimg.com/v2-48aeeac59b7e2a744bb774_r.jpg&&&/figure&&p&现代智人体内有了丹尼索瓦人基因,也能算获得了一些祖先的馈赠:青藏高原上的藏族人群对于高原的极强适应能力(拥有特殊的血红蛋白水平调控机制),可能就要感谢这种基因。&/p&&p&&br&&/p&&p&另外,丹尼索瓦人和尼安德特人的基因,也在一定程度上帮助现代智人拥有了更强健的免疫系统。&/p&&p&&br&&/p&&p&可惜智人祖先这种到处杂交留给我们后代的可不止是优点,还埋下了一些 bug:&/p&&p&&br&&/p&&p&&b&研究者怀疑,智人祖先的杂交可能导致男性后代生育能力下降。&/b&&/p&&h2&&b&现代男性生育能力下降了吗?&/b&&/h2&&p&之所以有这样的怀疑,是因为研究人员对于古人类*基因进行分析之后,注意到,无论丹尼索瓦人还是尼安德特人基因,在现代人 X 染色体上的含量比在常染色体上明显更低,甚至不及常染色体的 1/3。&br&&/p&&p&这是肿么回事?&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-0e97f2ec04acbb8b4318fdc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&400& data-rawheight=&399& class=&content_image& width=&400&&&/figure&&p&&br&&/p&&p&对此,一种可能的情况是:智人发生杂交的风流韵事时,性别搭配不均衡。主要是女性智人祖先与男性古人类祖先进行结合,那么混血的男孩没法遗传智人爸爸的X染色体,于是一代一代遗传下来,X 染色体中古人类基因含量就偏低了。&/p&&p&&br&&/p&&p&那为什么智人祖爷爷就不愿意跟丹尼索瓦人祖奶奶啪呢?难道是嫌女丹尼索瓦人不好看?&/p&&p&又或者,是因为男性古人类祖先抢走了智人祖奶奶强行….. 可如果是这样大批量劫掠,就不会被智人祖爷爷发现然后暴揍吗?&/p&&figure&&img src=&https://pic4.zhimg.com/v2-2a61a80e96bb_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&300& data-rawheight=&300& data-thumbnail=&https://pic4.zhimg.com/v2-2a61a80e96bb_b.jpg& class=&content_image& width=&300&&&/figure&&p&其实,研究者还有另一种解释。他们认为,X 染色体上古人类含量低这一现象要归咎于&b&杂交男性后代生育能力的下降&/b&。部分古人类(例如丹尼索瓦人)基因进入早期智人祖先基因组后,本来无害的基因可能变成对男性生育力有不良影响的基因,并普遍集中于杂交男性后代的X染色体内。&/p&&p&&br&&/p&&p&而在自然选择过程中,这种有害基因被逐渐剔除,就导致 X 染色体上的古人类基因含量小于常染色体。&/p&&p&&br&&/p&&p&不过,无论祖先的风流是不是对男性生育能力造成了影响,男人们还是得对自己的生殖健康上上心了。&/p&&p&&br&&/p&&p&&b&我才不会告诉你在最近四十年里,西方男性(主要包括北美、欧洲、澳洲和新西兰地区)的精子浓度和数量锐减到原来的一半了。&/b&&/p&&p&&br&&/p&&p&2017 年发表在《人类生殖医学前沿》(The Human Reproduction Update) 的一篇综述,对1981 至 2013 年发表的 7518 篇进行了研究,搜集并分析了其中185个研究中的 42935 份男性精子数据。分析结果显示,在过去近 40 年间(1973 年持续到 2011 年),西方男性单次射精的精子浓度平均每年降低 1.4%,总体降低了 52.4%;总精子数量平均每年降低 1.6%,总体降低了 59.3%。&/p&&p&&br&&/p&&p&主要的罪魁祸首是杀虫剂、塑料制品、肥胖、烟草、社会压力等等。&/p&&p&&br&&/p&&p&&b&我也不会告诉你,男性的重要基因 Y 染色体越来越短了。&/b&&/p&&p&1600 多万年前的 X、Y 染色体是一样长的,而现在 Y 染色体长度仅为 X 染色体的 1/3,而且有研究人员猜测 450 万年后 Y 染色体会彻底消失。自然界中的东欧鼹鼠和日本田鼠的雄性就在进化的过程中把 Y 染色体给丢干净了。&/p&&p&&br&&/p&&p&&b&我也不会告诉你,根据各种机构的调研,现代年轻人(主要是90后)的性生活频率确实下降了:&/b&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-55fcc5c63de4183ebee1dff_b.jpg& data-size=&normal& data-rawwidth=&1080& data-rawheight=&1085& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic3.zhimg.com/v2-55fcc5c63de4183ebee1dff_r.jpg&&&figcaption&《职场人性生活报告》来自网易春风&/figcaption&&/figure&&p&&br&&/p&&p&美国一项对近 27000 人进行调查的研究显示,比起
年代的同龄人,如今 20-24 岁的成年人中更少有人有性伴侣,更多年轻人选择佛系禁欲(研究发表在《性行为档案》(Archives of Sexual Behaviour)杂志上)。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-ee3e4b2377_b.jpg& data-size=&normal& data-rawwidth=&1600& data-rawheight=&1200& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic4.zhimg.com/v2-ee3e4b2377_r.jpg&&&figcaption&MUJI 被调侃为性冷淡风&/figcaption&&/figure&&p&(不排除是年轻人对于啪啪啪的理解变了,导致调查结果出现偏差。)&/p&&p&&br&&/p&&p&&b&我要告诉你们的是一个「好消息」,一般人我不告诉他,那就是:&/b&&/p&&p&&br&&/p&&p&反正所有男人都是「变性人」。&b&有没有Y染色体有什么大不了的。&/b&&/p&&p&&br&&/p&&p&其实我的意思是,真正决定性别的是 Y 染色体上的 &i&SRY&/i& 基因,而不是 Y 染色体本身。&/p&&p&&br&&/p&&p&&i&SRY &/i&基因的表达像个开关,负责启动睾丸的形成,以及以后的雄性器官发育过程。其作用对象是 &i&SOX9&/i&。在 XY 染色体中,如果 &i&SOX9&/i& 增强表达,辅助细胞就会去形成男性器官。如果 &i&SOX9&/i& 在原地躺尸,既不增强也不减弱,那辅助细胞就会继续发育成女性器官,有 Y 染色体也没用。&/p&&p&&br&&/p&&p&而且,&b&随着科技进步,没有精子也能生下后代啦。&/b&&/p&&p&2015年中科院上海生科院的李劲松团队,就成功利用两个老鼠的卵子繁衍出了健康的后代。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-9d1c06e90d0dcc9a4a6bcbadd2fc7df4_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&456& data-rawheight=&539& class=&origin_image zh-lightbox-thumb& width=&456& data-original=&https://pic3.zhimg.com/v2-9d1c06e90d0dcc9a4a6bcbadd2fc7df4_r.jpg&&&/figure&&p&更不要说早在 20 年前,克隆羊多莉就已经是单纯靠三个妈生下来的了。&/p&&p&&br&&/p&&p&是不是听到这个,你松了一口气:终于不用担心自己的生育能力下降了?&/p&&p&&br&&/p&&p&&i&注:文中所用「古人类」一词不包含早期智人。&/i&&/p&&p&&br&&/p&&p&—————————————— 自我广告分割线——————————&/p&&p&关注&a href=&https://zhuanlan.zhihu.com/c_& class=&internal&&智人观察室&/a&,了解更多智人的特别故事&/p&&p&参考:&/p&&p&&i&Reich, David, et al. &Genetic history of an archaic hominin group from Denisova Cave in Siberia.& Nature 468.): .&/i&&/p&&p&&i&Sankararaman, Sriram, et al. &The Combined Landscape of Denisovan and Neanderthal Ancestry in Present-Day Humans.& Current Biology (2016).&/i&&/p&&p&&i&Green, Richard E., et al. &A draft sequence of the Neandertal genome.& science 328.): 710-722.&/i&&/p&&p&&i&Simonti, Corinne N., et al. &The phenotypic legacy of admixture between modern humans and Neandertals.& Science 351.): 737-741.&/i&&/p&&p&&i&Sankararaman, Sriram, et al. &The genomic landscape of Neanderthal ancestry in present-day humans.& Nature 507.): 354-357.&/i&&/p&&p&&i&Hagai Levine, Niels J?rgensen, etc, Temporal trends in sperm count: a systematic review and meta-regression analysis,Human reproduction update&/i&&/p&&p&&/p&&p&&/p&
关注人类进化史的朋友们都知道,我们的祖先智人是个风流的物种。他们跟古人类尼安德特人啪啪啪出混血的我们之后,在我们的体内留下了一些「定时炸弹」,例如导致抑郁症、II型糖尿病、吸烟成瘾等,实在是拖了现代智人的后腿。 不过,智人欠下的风流债可不止…
&figure&&img src=&https://pic3.zhimg.com/v2-ecf007ea55d809ead15fc1d_b.jpg& data-rawwidth=&940& data-rawheight=&341& class=&origin_image zh-lightbox-thumb& width=&940& data-original=&https://pic3.zhimg.com/v2-ecf007ea55d809ead15fc1d_r.jpg&&&/figure&&p&CS231n近几年一直是计算机视觉领域和深度学习领域最为经典的课程之一。而最近刚刚结课的CS231n Spring 2017 仍由李飞飞主讲,并邀请了Goodfellow等人对其中部分章节详细介绍。本课程从计算机视觉的基础概念开始,在奠定了基本分类模型、神经网络和优化算法的基础后,详细介绍了CNN、RNN、GAN、RL等深度模型在计算机视觉上的应用。前天,斯坦福开放了该课程的全部视频,并且还有配套英文字幕。因此,CS231n 2017 春季课程包括 PPT 和视频在内的所有教学资料都已开放。机器之心将为各位读者介绍该课程,并提供相应的资源,Bilibili视频地址由微博知名博主爱可可老师提供。&/p&&p&&br&&/p&&p&课件地址:&a href=&https://link.zhihu.com/?target=http%3A//cs231n.stanford.edu/slides/2017/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Index of /slides/2017&/a&&/p&&p&课程视频地址:&a href=&https://link.zhihu.com/?target=https%3A//www.youtube.com/playlist%3Flist%3DPL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&youtube.com/playlist?&/span&&span class=&invisible&&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&Bilibili视频地址:&a href=&https://link.zhihu.com/?target=http%3A//www.bilibili.com/video/avpage%3D1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯坦福2017季CS231n深度视觉识别课程视频(by Fei-Fei Li, Justin Johnson, Serena Yeung)(英文字幕)&/a&&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-bafa_b.jpg& data-rawwidth=&1136& data-rawheight=&868& class=&origin_image zh-lightbox-thumb& width=&1136& data-original=&https://pic3.zhimg.com/v2-bafa_r.jpg&&&/figure&&p&&br&&/p&&p&以下为该课程的内容大纲&/p&&p&&br&&/p&&p&&b&Lecture 1:计算机视觉的概述、历史背景以及课程计划&/b&&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-7e871fc99b6faece_b.jpg& data-rawwidth=&1054& data-rawheight=&655& class=&origin_image zh-lightbox-thumb& width=&1054& data-original=&https://pic4.zhimg.com/v2-7e871fc99b6faece_r.jpg&&&/figure&&p&&b&Lecture 2:图像分类——包括数据驱动(data-driven)方法,K 近邻方法(KNN)和线性分类(linear classification)方法&/b&&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-9f8393c36338de9ceb67c_b.jpg& data-rawwidth=&1420& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&1420& data-original=&https://pic3.zhimg.com/v2-9f8393c36338de9ceb67c_r.jpg&&&/figure&&p&&b&Lecture 3:损失函数和优化(loss Function and optimization)&/b&&/p&&p&&br&&/p&&p&这一讲主要分为三部分内容:&/p&&p&&br&&/p&&p&1. 继续上一讲的内容介绍了线性分类方法;&/p&&p&2. 介绍了高阶表征及图像的特点;&/p&&p&3. 优化及随机梯度下降(SGD)。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-178e27d5aa11ecabc04b2ab_b.jpg& data-rawwidth=&798& data-rawheight=&464& class=&origin_image zh-lightbox-thumb& width=&798& data-original=&https://pic2.zhimg.com/v2-178e27d5aa11ecabc04b2ab_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 4:神经网络&/b&&/p&&p&&br&&/p&&p&包括经典的反向传播算法(back-propagation);多层感知机结构(multilayer perceptrons);以及神经元视角。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-be714b19ac48ff4e9695_b.jpg& data-rawwidth=&926& data-rawheight=&470& class=&origin_image zh-lightbox-thumb& width=&926& data-original=&https://pic1.zhimg.com/v2-be714b19ac48ff4e9695_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 5:卷积神经网络(CNN)&/b&&/p&&p&&br&&/p&&p&主要分为三部分内容:&/p&&p&&br&&/p&&p&1. 卷积神经网络的历史背景及发展;&/p&&p&2. 卷积与池化(convolution and pooling);&/p&&p&3. ConvNets 的效果&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-52230ffe3a61ffaca17cd82_b.jpg& data-rawwidth=&1056& data-rawheight=&503& class=&origin_image zh-lightbox-thumb& width=&1056& data-original=&https://pic2.zhimg.com/v2-52230ffe3a61ffaca17cd82_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 6:如何训练神经网络 I&/b&&/p&&p&&br&&/p&&p&介绍了各类激活函数,数据预处理,权重初始化,分批归一化(batch normalization)以及超参优化(hyper-parameter optimization)。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-b5b3f35aa62d_b.jpg& data-rawwidth=&967& data-rawheight=&534& class=&origin_image zh-lightbox-thumb& width=&967& data-original=&https://pic2.zhimg.com/v2-b5b3f35aa62d_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 7:如何训练神经网络 II&/b&&/p&&p&&br&&/p&&p&介绍了优化方法(optimization)、模型集成(model ensembles)、正则化(regularization)、数据扩张(data-augmentation)和迁移学习(transfer learning)。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-edf47fe0ba6_b.jpg& data-rawwidth=&865& data-rawheight=&429& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic1.zhimg.com/v2-edf47fe0ba6_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 8: 深度学习软件基础&/b&&/p&&p&&br&&/p&&p&1. 详细对比了 CPU 和 GPU;&/p&&p&2. TensorFlow、Theano、PyTorch、Torch、Caffe 实例的具体说明;&/p&&p&3. 各类框架的对比及用途分析。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-5565be20cab0cb0ee0f55ca_b.jpg& data-rawwidth=&579& data-rawheight=&237& class=&origin_image zh-lightbox-thumb& width=&579& data-original=&https://pic3.zhimg.com/v2-5565be20cab0cb0ee0f55ca_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 9:卷积神经网络架构(CNN Architectures)&/b&&/p&&p&&br&&/p&&p&该课程从 LeNet-5 开始到 AlexNet、VGG、GoogLeNet、ResNet 等由理论到实例详细描述了卷积神经网络的架构与原理。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-38e7ed91cda8459768dd_b.jpg& data-rawwidth=&922& data-rawheight=&508& class=&origin_image zh-lightbox-thumb& width=&922& data-original=&https://pic4.zhimg.com/v2-38e7ed91cda8459768dd_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 10:循环神经网络(Recurrent Neural Networks)&/b&&/p&&p&&br&&/p&&p&该课程先详细介绍了 RNN、LSTM 和 GRU 的架构与原理,再从语言建模、图像描述、视觉问答系统等对这些模型进行进一步的描述。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-6e2dea8da356e493b04529_b.jpg& data-rawwidth=&934& data-rawheight=&526& class=&origin_image zh-lightbox-thumb& width=&934& data-original=&https://pic2.zhimg.com/v2-6e2dea8da356e493b04529_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 11:检测与分割(Detection and Segmentation)&/b&&/p&&p&&br&&/p&&p&该课程在图像分类的基础上介绍了其他的计算机视觉任务,如语义分割、目标检测和实例分割等,同时还详细介绍了其它如 R-CNN、Fast R-CNN、Mask R-CNN 等架构。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-cb4b0f5bbf153fc31dd05_b.jpg& data-rawwidth=&942& data-rawheight=&463& class=&origin_image zh-lightbox-thumb& width=&942& data-original=&https://pic1.zhimg.com/v2-cb4b0f5bbf153fc31dd05_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 12:可视化和理解(Visualizing and Understanding)&/b&&/p&&p&&br&&/p&&p&该部分不仅讲述了特征可视化和转置,同时还描述了对抗性样本和像 DeepDream 那样的风格迁移系统。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-33ce58e14cdf_b.jpg& data-rawwidth=&947& data-rawheight=&494& class=&origin_image zh-lightbox-thumb& width=&947& data-original=&https://pic2.zhimg.com/v2-33ce58e14cdf_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 13:生成模型(Generative Models)&/b&&/p&&p&&br&&/p&&p&该章节从 PixelRNN 和 PixelCNN 开始,再到变分自编码器和生成对抗网络详细地讲解了生成模型。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-7f962f4d5d5cc9d793a64534b4aaad2c_b.jpg& data-rawwidth=&950& data-rawheight=&498& class=&origin_image zh-lightbox-thumb& width=&950& data-original=&https://pic3.zhimg.com/v2-7f962f4d5d5cc9d793a64534b4aaad2c_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 14:强化学习(Reinforcement Learning)&/b&&/p&&p&&br&&/p&&p&该章节先从基本概念解释了什么是强化学习,再解释了马尔可夫决策过程如何形式化强化学习的基本概念。最后对 Q 学习和策略梯度进行了详细的刻画,包括架构、优化策略和训练方案等等。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-786b66e727f7cc482c2309_b.jpg& data-rawwidth=&928& data-rawheight=&409& class=&origin_image zh-lightbox-thumb& width=&928& data-original=&https://pic4.zhimg.com/v2-786b66e727f7cc482c2309_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 15:深度学习高效的方法和硬件(Efficient Methods and Hardware for Deep Learning)&/b&&/p&&p&&br&&/p&&p&该章节首先展示了深度学习的三大挑战:即模型规模、训练速度和能源效率。而解决方案可以通过联合设计算法-硬件以提高深度学习效率,构建更高效的推断算法等,&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-cf2aa72aed3bdae_b.jpg& data-rawwidth=&930& data-rawheight=&696& class=&origin_image zh-lightbox-thumb& width=&930& data-original=&https://pic2.zhimg.com/v2-cf2aa72aed3bdae_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Lecture 16:对抗性样本和对抗性训练(Adversarial Examples and Adversarial Training)&/b&&/p&&p&&br&&/p&&p&该章节由 Ian Goodfellow 于 5 月 30 日主讲,主要从什么事对抗性样本、对抗性样本产生的原因、如何将对抗性样本应用到企业机器学习系统中、及对抗性样本会如何提升机器学习的性能等方面详细描述对抗性样本和对抗性训练。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-4d32dfb94f2f08bb9837518e_b.jpg& data-rawwidth=&900& data-rawheight=&614& class=&origin_image zh-lightbox-thumb& width=&900& data-original=&https://pic3.zhimg.com/v2-4d32dfb94f2f08bb9837518e_r.jpg&&&/figure&&p&&br&&/p&&p&&b&机器之心报道&/b&&/p&&p&&/p&
CS231n近几年一直是计算机视觉领域和深度学习领域最为经典的课程之一。而最近刚刚结课的CS231n Spring 2017 仍由李飞飞主讲,并邀请了Goodfellow等人对其中部分章节详细介绍。本课程从计算机视觉的基础概念开始,在奠定了基本分类模型、神经网络和优化算法…
&figure&&img src=&https://pic4.zhimg.com/v2-0f1b0195bf5aaefc9a319_b.jpg& data-rawwidth=&1920& data-rawheight=&1080& class=&origin_image zh-lightbox-thumb& width=&1920& data-original=&https://pic4.zhimg.com/v2-0f1b0195bf5aaefc9a319_r.jpg&&&/figure&&blockquote&&p&&em&本文作者在 Github 上建立了一个代码速查表,对机器学习初学者来说是不可多得的一个资源。&/em&&br&&/p&&/blockquote&&p&对于初学者来讲,入门机器学习和深度学习非常困难;同时深度学习库也难以理解。通过收集多方资源,我在 Github 上创建了一个速查表库,希望能对你有所帮助。欢迎访问这个库,并完善它(如果你也有速查表)。&/p&&p&项目地址:&a href=&https://link.zhihu.com/?target=https%3A//github.com/kailashahirwar/cheatsheets-ai& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&kailashahirwar/cheatsheets-ai&/a&&/p&&br&&p&&strong&1.Keras&/strong&&/p&&br&&p&Keras 是一个非常强大且容易上手的深度学习库;当 Keras 接入 Theano 和 TensorFlow 时,后两者可提供高水平的神经网络 API 以开发和评估深度学习模型。该速查表可用于 Python 数据科学和机器学习。&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-b84bf4fbce7d4e9dc62b9ca79a82eae7_b.jpg& data-rawwidth=&2339& data-rawheight=&1654& class=&origin_image zh-lightbox-thumb& width=&2339& data-original=&https://pic3.zhimg.com/v2-b84bf4fbce7d4e9dc62b9ca79a82eae7_r.jpg&&&/figure&&p&&strong&2. Numpy&/strong&&/p&&br&&p&Numpy 库是 Python 中科学性计算的核心库,它提供高性能、多维度的数组对象,以及对这些数组进行运算的工具。该速查表可用于 Python 数据科学和机器学习。&/p&&br&&figure&&img src=&https://pic2.zhimg.com/v2-a3f08effc3e5a62dace4842_b.jpg& data-rawwidth=&1753& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1753& data-original=&https://pic2.zhimg.com/v2-a3f08effc3e5a62dace4842_r.jpg&&&/figure&&p&&strong&3. Pandas&/strong&&/p&&br&&p&这张 Pandas 速查表主要用于数据整理(data wrangling)。&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-6214dbcfc6fc4af8b6db0355beace77a_b.jpg& data-rawwidth=&3056& data-rawheight=&2362& class=&origin_image zh-lightbox-thumb& width=&3056& data-original=&https://pic3.zhimg.com/v2-6214dbcfc6fc4af8b6db0355beace77a_r.jpg&&&/figure&&figure&&img src=&https://pic4.zhimg.com/v2-dfe9931ccdde8e8ac9c0b9e3b88a5535_b.jpg& data-rawwidth=&3056& data-rawheight=&2362& class=&origin_image zh-lightbox-thumb& width=&3056& data-original=&https://pic4.zhimg.com/v2-dfe9931ccdde8e8ac9c0b9e3b88a5535_r.jpg&&&/figure&&p&Pandas 库构建在 NumPy 上,并为 Python 编程语言提供易于上手的数据结构和数据分析工具。该速查表可用于 Python 数据科学和机器学习。&/p&&br&&figure&&img src=&https://pic2.zhimg.com/v2-df32b146eb14e0b33ca03_b.jpg& data-rawwidth=&1753& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1753& data-original=&https://pic2.zhimg.com/v2-df32b146eb14e0b33ca03_r.jpg&&&/figure&&p&&strong&4. SciPy&/strong&&/p&&br&&p&SciPy 库是科学性计算的核心包之一,科学性计算可提供数学算法和构建在 Python 的 NumPy 扩展上的便捷函数 (Convenience Functions) ;该表中还包括线性代数的部分。该速查表可用于 Python 数据科学和机器学习。&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-fe4f441dc9b56e026c9a014_b.jpg& data-rawwidth=&1753& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1753& data-original=&https://pic3.zhimg.com/v2-fe4f441dc9b56e026c9a014_r.jpg&&&/figure&&p&&strong&5. Matplotlib&/strong&&/p&&br&&p&Matplotlib 是一个 Python 2D 绘图库,它在平台上以多种硬拷贝格式和交互环境生成发表品质的图。该速查表用于 Python 数据科学。&/p&&br&&figure&&img src=&https://pic1.zhimg.com/v2-ca4c69ecea_b.jpg& data-rawwidth=&1753& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1753& data-original=&https://pic1.zhimg.com/v2-ca4c69ecea_r.jpg&&&/figure&&p&&strong&6. Scikit-learn&/strong&&/p&&br&&p&Scikit-learn 是一个开源 Python 库,通过统一接口实现一系列的机器学习、预处理、交叉验证和视觉化算法。该速查表可用于 Python 数据科学和机器学习。&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-93affe5dfe03093faffc23_b.jpg& data-rawwidth=&1753& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1753& data-original=&https://pic3.zhimg.com/v2-93affe5dfe03093faffc23_r.jpg&&&/figure&&p&&strong&7. Neural Networks Zoo(神经网络大全)&/strong&&/p&&br&&p&该速查表几乎涵盖了所有类型的神经网络。&/p&&br&&figure&&img src=&https://pic1.zhimg.com/v2-81c72edcbf3d514a4e2481_b.jpg& data-rawwidth=&2000& data-rawheight=&3000& class=&origin_image zh-lightbox-thumb& width=&2000& data-original=&https://pic1.zhimg.com/v2-81c72edcbf3d514a4e2481_r.jpg&&&/figure&&p&&strong&8. ggplot2&/strong&&/p&&br&&p&ggplot2 基于图形语法,其思想是你可以利用相同的几个组件构建所有的图形:一个数据集、一个几何集(表征数据点的视觉化标记)和一个协作系统。该速查表用于数据可视化。&/p&&p&&figure&&img src=&https://pic1.zhimg.com/v2-e03abacd8ce3_b.jpg& data-rawwidth=&1079& data-rawheight=&829& class=&origin_image zh-lightbox-thumb& width=&1079& data-original=&https://pic1.zhimg.com/v2-e03abacd8ce3_r.jpg&&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-83895b96ecdce702d968cec_b.jpg& data-rawwidth=&1073& data-rawheight=&815& class=&origin_image zh-lightbox-thumb& width=&1073& data-original=&https://pic1.zhimg.com/v2-83895b96ecdce702d968cec_r.jpg&&&/figure&选自&a href=&https://link.zhihu.com/?target=https%3A//medium.com/%40kailashahirwar/essential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Medium&/a&
&b&机器之心编译&/b&&/p&
本文作者在 Github 上建立了一个代码速查表,对机器学习初学者来说是不可多得的一个资源。 对于初学者来讲,入门机器学习和深度学习非常困难;同时深度学习库也难以理解。通过收集多方资源,我在 Github 上创建了一个速查表库,希望能对你有所帮助。欢迎访…
&figure&&img src=&https://pic2.zhimg.com/v2-6dc18db2ea8cbbc215ab84e7c0b417d0_b.jpg& data-rawwidth=&1240& data-rawheight=&744& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&https://pic2.zhimg.com/v2-6dc18db2ea8cbbc215ab84e7c0b417d0_r.jpg&&&/figure&&p&leftlet给R语言提供了很好用的交互式动态地图接口,其在Python中得API接口包名为folium(不知道包作者为何这样起名字,和leaflet已经扯不上关系了),可以满足我们平时常用的热力图、填充地图、路径图、散点标记等高频可视化场景。&/p&&p&关于folium在热力图上的用法,可以参考这一篇分享:&br&&u&&a href=&https://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMzA3Njc0NzA0MA%3D%3D%26mid%3D%26idx%3D1%26sn%3Db5cccc57b9cd45ddchksm%3D848cb951b3fb20591cbbcdfaf%26scene%3D21%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&使用Python中的folium包创建热力密度图&/a&&/u&&/p&&p&本篇主要介绍其在point、line、polygon这三个地理信息场景下得应用:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&import pandas as pd
import numpy as np
import folium
from folium import plugins
import webbrowser
import geopandas as gp
&/code&&/pre&&/div&&h2&&b&Point:&/b&&/h2&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&full = pd.read_excel(&D:/Python/File/Cities2015.xlsx&)
full = full.dropna()
&/code&&/pre&&/div&&h2&默认情况下folium.Marker函数用于在空间范围内标记点,点得样式是雨滴形状,但是也可以使用folium.RegularPolygonMarker函数来自定义点样式:&/h2&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&schools_map = folium.Map(location=[full['lat'].mean(), full['lon'].mean()], zoom_start=10)
marker_cluster = plugins.MarkerCluster().add_to(schools_map)for name,row in full.iterrows():
folium.Marker([row[&lat&], row[&lon&]], popup=&{0}:{1}&.format(row[&cities&], row[&GDP&])).add_to(marker_cluster)
#folium.RegularPolygonMarker([row[&lat&], row[&lon&]], popup=&{0}:{1}&.format(row[&cities&], row[&GDP&]),number_of_sides=10,radius=5).add_to(marker_cluster)
display(schools_map)
#schools_map.save('schools_map.html')
#webbrowser.open('schools_map.html')
&/code&&/pre&&/div&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-2c2b0bd203da9a192d22_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1244& data-rawheight=&752& class=&origin_image zh-lightbox-thumb& width=&1244& data-original=&https://pic4.zhimg.com/v2-2c2b0bd203da9a192d22_r.jpg&&&/figure&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-8cfe601c12e331c0cc691c_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1230& data-rawheight=&741& class=&origin_image zh-lightbox-thumb& width=&1230& data-original=&https://pic1.zhimg.com/v2-8cfe601c12e331c0cc691c_r.jpg&&&/figure&&p&&br&&/p&&p&display用于在编辑器内展示交互地图,save方法可以将交互地图以html文件得形式保存至本地磁盘,webbrowser.open方法可以调用默认浏览器打开本地html格式的交互地图。&/p&&h2&&b&polygon:&/b&&/h2&&p&因为leaflet使用的在线地图并不开放地址匹配功能,也就意味着我们无法通过直接输入行政区名称来获取行政区划边界,所以在制作填充地图时,仍然需要我们构建本地素材。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&mydata
= pd.read_csv(&D:/R/rstudy/Province/geshengzhibiao.csv&, encoding = 'gb18030')
china_map = gp.GeoDataFrame.from_file(&D:/R/rstudy/CHN_adm/bou2_4p.shp&, encoding = 'gb18030')
#china_map = gp.GeoDataFrame.from_file(&D:/R/mapdata/State/china.geojson&, encoding = 'gb18030')
China_map = folium.Map(location=[35,120], zoom_start=4)
China_map.choropleth(
geo_data=open('D:/R/mapdata/State/china.geojson',encoding = 'utf-8').read(),
data=mydata,
columns=['province', 'zhibiao'],
key_on= 'feature.properties.name',
fill_color='YlGn',
fill_opacity=0.7,
line_opacity=0.2)
display(China_map)
China_map.save(&China_map.html&)
&/code&&/pre&&/div&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-a0f9b3bd3c40_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1280& data-rawheight=&700& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/v2-a0f9b3bd3c40_r.jpg&&&/figure&&p&&br&&/p&&p&好在folium的choropleth函数直接支持json格式地图,仅需提供素材地址即可,data中应该包含与json素材中的属性表和地理信息边界保持一致得映射表,columns用于指定要用到的字段名称。key_on用于指定json地图数据中和你指定得data中对应得连接键(相当于主键)。&br&fill_color可以指定用于配色的colorBrewer调色板。&/p&&h2&&b&polyline&/b&&/h2&&p&folium中得线图制作也较为简单,仅需提供给folium.PolyLine函数一组带有嵌套列表或者元组得经纬度点即可。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&mydata1 =full.sample(20).loc[:,[&lat&,&lon&]].values.tolist()
mydata2 =[(i,j) for i,j in full.sample(20).loc[:,[&lat&,&lon&]].values.tolist()]
oneUserMap = folium.Map(location=[40.6],zoom_start=4)
folium.PolyLine(mydata1,color = 'black').add_to(oneUserMap)
display(oneUserMap)
oneUserMap = folium.Map(location=[40.6],zoom_start=4)
folium.PolyLine(mydata2,color = 'black').add_to(oneUserMap)
display(oneUserMap)
&/code&&/pre&&/div&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-dd969b931_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1240& data-rawheight=&692& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&https://pic4.zhimg.com/v2-dd969b931_r.jpg&&&/figure&&p&&br&&/p&&h2&稍微增加一些循环条件就可以构造出来实用的路径图场景:&/h2&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&def map_fun():
myresult = full.loc[:,[&lat&,&lon&,&cities&,&pop&]].values
oneUserMap = folium.Map(location=[40.6],zoom_start=4)
for e in myresult:
folium.RegularPolygonMarker(
[e[0],e[1]],
popup=str(e[2])+&:&+str(e[3]),
fill_color='#769d96',
number_of_sides=10,
).add_to(oneUserMap)
= full.loc[full['cities']!='郑州市',[&lat&,&lon&]].values.tolist()
for i in range(len(others)):
zhengzhou = full.loc[full['cities']=='郑州市',[&lat&,&lon&]].values.tolist()
zhengzhou.append(others[i])
folium.PolyLine(
locations = zhengzhou,
color = 'black'
).add_to(oneUserMap)
display(oneUserMap)
return Noneif __name__ == '__main__':
&/code&&/pre&&/div&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-ce6e036af691b7625393eee3cbfe0560_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1240& data-rawheight=&744& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&https://pic3.zhimg.com/v2-ce6e036af691b7625393eee3cbfe0560_r.jpg&&&/figure&&p&&br&&/p&&p&&a href=&https://link.zhihu.com/?target=https%3A//edu.hellobi.com/course/264& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&edu.hellobi.com/course/&/span&&span class=&invisible&&264&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&/p&
leftlet给R语言提供了很好用的交互式动态地图接口,其在Python中得API接口包名为folium(不知道包作者为何这样起名字,和leaflet已经扯不上关系了),可以满足我们平时常用的热力图、填充地图、路径图、散点标记等高频可视化场景。关于folium在热力图上的用…
&p&先简单自我介绍一下吧。&/p&&p&高中毕业于英国当地一所国际高中,A-Level拿了A*A*A*A*a,后来稀里糊涂就考进了牛津的统计系就读Mathematics and Statistics专业。&/p&&p&作为早期的牛津本科毕业生,我自己的学生里都有十几个进了牛剑的数学系,校友更是不在话下。当然咱们团队里也有不少一起奋斗的伙伴,还有很多朋友和学生是来自Imperial, UCL, LSE和Warwick的。因为之前无聊的时候刚好比较过各个学校数学系的教学和考试,所以这个问题我还是比较有发言权的。&/p&&p&-----------------------------------------------------(分割线)&/p&&h2&&b&两校关系&/b&&/h2&&p&都说咱们两家关系不好,其实咱们平时就是互黑玩玩。竞争嘛自然是有的,但是惺惺相惜远大于竞争。除了一些特别极端的人之外,这一点无论对于英国人还是我们华人群体都是一样的。而且牛津和剑桥毕业的学生毕竟还是太少,两家并一并还能social一下,不然真是没啥圈子了。平时我们也常常混伦敦的圈子,我们会跑去逛精彩的大都市看歌剧、逛博物馆、逛街购物、开派对,伦敦的朋友也经常来牛津剑桥吃formal,参加舞会,天气好的时候划划船。总的来说英国的大家相处都挺愉快的。&/p&&p&-----------------------------------------------------(分割线)&/p&&h2&&b&专业学术 (Overall)&/b&&/h2&&p&要分析大学的学术能力,主要看大学的顶尖研究人员构成、发表的4星级以上学术研究成果、研究成绩和科研实力。最具参考价值的是英国政府每7年颁布一次的REF报告(Research Excellence Framework)。该份报告本身没有排名,但是英国泰晤士报会在REF报告发表的第一时间将内容整理成为详细的大学科研排名。&/p&&p&以下截图为2014年泰晤士报关于数学专业的排名解析:&/p&&br&&figure&&img src=&https://pic1.zhimg.com/50/v2-68ddcea1160_b.jpg& data-rawwidth=&1202& data-rawheight=&32& class=&origin_image zh-lightbox-thumb& width=&1202& data-original=&https://pic1.zhimg.com/50/v2-68ddcea1160_r.jpg&&&/figure&&br&&figure&&img src=&https://pic4.zhimg.com/50/v2-4f40929acc67b158eff6bef_b.jpg& data-rawwidth=&1206& data-rawheight=&581& class=&origin_image zh-lightbox-thumb& width=&1206& data-original=&https://pic4.zhimg.com/50/v2-4f40929acc67b158eff6bef_r.jpg&&&/figure&&p&根据这份报告我们不难看出三点:&/p&&p&1. 牛津大学和剑桥大学的数学系是遥遥领先于其他大学的,而且差距相对不是很大。&/p&&p&2. 牛津大学在发表研究成果数量上略高于剑桥大学(其中一个原因是牛津大学比剑桥大学多拥有30%的顶尖学者)。&/p&&p&3. 剑桥大学在过去七年里,在影响力方面被牛津大幅超越。&/p&&p&大家都知道,传统观念上来看剑桥的数学系比牛津的数学系似乎要更强一些,那么为什么在这过去七年发生了逆转呢?其实是因为牛津大学在数学系早在2010年之前就已经开启了数学系的改革,加大投入硬件和软件设施,大量召集来自全球各地的顶尖数学家。&/p&&p&-----------------------------------------------------(分割线)&/p&&h2&&b&专业学术 (纯数学、应用数学、统计学三大分支)&/b&&/h2&&p&纯数学方面:牛津与剑桥基本没有太大差别,近年来牛津略强,我还在学校的时候就发现好些剑桥的教授跑来牛津了&/p&&p&应用数学:剑桥优势明显。剑桥在自然科学方面的造诣远高于牛津,也促进了应用数学在剑桥集中产生研究成果,可以说是旺盛的需求拉动了剑桥应用数学的发展。&/p&&p&统计学:这是数学最小的一个分支,但是在牛津受到了很高的重视,得到了巨大的发展。目前牛津和美国斯坦福大学的统计系并列是全球最重要的统计学研究中心。&/p&&p&-----------------------------------------------------(分割线)&/p&&h2&教学相关&/h2&&p&其实吧,研究成果怎么样只能说明人家顶尖科研力量强,和我们这些本科生研究生没啥太大关系。我这边主要谈一谈培养数学人才的本科阶段情况比较:&/p&&p&1. 学术难度&/p&&p&我曾经拉着小伙伴比较了牛津大学、剑桥大学、帝国理工学院、伦敦大学学院、伦敦政经学院和华威大学的数学系大一年级的教学内容、作业内容和考试内容。总结下来学术难度是&/p&&p&&b&Cambridge & Oxford & Imperial College London && Warwick & UCL = LSE&/b&&/p&&p&2. 学习困难度&/p&&p&牛津和剑桥学期短,大量依靠自主学习和导师制度,基本上50%的学习内容要考本科生自己去学习完成。剑桥在单题难度上略高于牛津,剑桥学生花在学习上的时间要高于牛津的学生。&/p&&p&帝国理工学院在课堂上教授的内容要多于牛津和剑桥,但是学术压力依然较大,需要学生课外付出不少努力。&/p&&p&华威大学还是不错的,的确是数学强校,但是在困难度上要低于帝国理工,给的辅助材料也比较多。&/p&&p&UCL和LSE基本上不以数学出名,学习困难度要远低于其他三所学校。不过这两所名校本来就更偏向于社会实践,不是以学术钻研度取胜的。不是潜心搞研究的人选择这两所学校其实更合理。&/p&&p&综上:&b&Cambridge & Oxford & Imperial College London & Warwick & UCL = LSE&/b&&/p&&p&-----------------------------------------------------(分割线)&/p&&h2&申请难度和学霸数量&/h2&&p&从录取率来说,剑桥大于牛津,也就略大小几个百分点而已。&/p&&p&但是由于两所学校的笔试难度相差太大,MAT远远容易于STEP,所以总体而言剑桥的学霸多于牛津的学霸。一般建议搞竞赛的同学申请剑桥,比较不容易出意外。&/p&&p&&b&-------------------------------------------------------------------------------------------------(长长的分割线)&/b&&/p&&p&&b&最后的最后简单说一下!&/b&&/p&&p&&b&如果想搞科研(硕士博士)的,主要是选研究方向和导师,其实和学校的综合学术影响力也没有太大关系。&/b&&/p&&p&&b&如果是要读本科的,想体验“天降大任,劳其筋骨”的同学可以报剑桥,想稍微平衡一点的选牛津,对学术没有太大兴趣的去LSE和UCL吧~&/b&&/p&&p&&b&知乎真是一个神奇的平台,希望对大家有帮助!&/b&&/p&
先简单自我介绍一下吧。高中毕业于英国当地一所国际高中,A-Level拿了A*A*A*A*a,后来稀里糊涂就考进了牛津的统计系就读Mathematics and Statistics专业。作为早期的牛津本科毕业生,我自己的学生里都有十几个进了牛剑的数学系,校友更是不在话下。当然咱们…
&figure&&img src=&https://pic4.zhimg.com/v2-b2fc97ac4ad32c_b.jpg& data-rawwidth=&600& data-rawheight=&600& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic4.zhimg.com/v2-b2fc97ac4ad32c_r.jpg&&&/figure&&p&选自Sciencedaily,参与:张倩、王淑婷。&/p&&blockquote&近日,来自加州理工学院的研究人员开发出一种由 DNA 制成的新型人工神经网络。该网络解决了一个经典的机器学习问题:正确识别手写数字。该项研究中,研究者用了 36 个手写数字 6 和 7 作为测试例子,结果表明这种新型神经网络能够正确识别出所有的数字。该研究是在生物工程助理教授 Lulu Qian 的实验室中完成的。相关论文于 7 月 4 日上传网络,并将出现在 7 月 19 日的纸质版《Nature》杂志上。&/blockquote&&p&科学家们已经从 DNA 中开发出一种人工神经网络,能够识别嘈杂和高度复杂的分子信息。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-e0e54a97eb_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&600& data-rawheight=&600& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic2.zhimg.com/v2-e0e54a97eb_r.jpg&&&/figure&&p&包含由 DNA 构成的人工神经网络的一个微滴概念图(droplet Conception),该网络被设计成可以识别复杂和嘈杂的分子信息,即「分子笔迹」。&/p&&p&&br&&/p&&p&加州理工学院的研究人员开发了一种由 DNA 制成的人工神经网络,可以解决一个经典的机器学习问题:正确识别手写数字。这项研究迈出了重要一步,证明我们具备了将人工智能编程到合成生物分子回路中的能力。&/p&&p&「尽管研究者刚刚开始尝试在分子机器中创造人工智能,但其潜力是不可否认的,」Qian 表示。「电子计算机和智能手机使得现代人类的能力高于 100 多年前,与此类似,在未来的近百年里,人工分子机器可能制造出由分子组成的一切事物,甚至可能包括油漆和绷带,使得人类更有能力,适应环境的能力也更强。」&/p&&p&人工神经网络是在人类大脑的启发下创造的数学模型。尽管比真实的大脑简单得多,但该网络可以像神经元网络一样工作,也能处理复杂信息。Qian 的实验室进行该研究的最终目标是用由 DNA 组成的神经网络编程智能行为(计算、做出选择等方面的能力)。&/p&&p&Qian 表示,「每个人大脑中有 800 亿个神经元,用来做出高度复杂的决策。蛔虫等小动物可以仅利用几百个神经元做出简单决策。在本研究中,我们设计、创造了可以像一个小的神经网络一样工作的生化回路,用来对可能比以前的信息复杂得多的分子信息进行分类。」&/p&&p&为了证明基于 DNA 的神经网络的能力,Qian 实验室的研究生 Kevin Cherry 选择了一项任务:识别手写内容,该任务是电子人工神经网络面临的一个经典挑战。&/p&&p&人的笔迹可以有很大的不同,所以当一个人仔细检查潦草的数字序列时,大脑会执行复杂的计算任务来识别它们。因为甚至对人类来说,识别他人潦草的笔迹也很难,所以识别手写数字是将智能编程到人工神经网络中的常见测试。这些网络必须被「教导」如何识别数字,考虑手写的变化,然后将未知数字与它们所谓的记忆进行比较,并确定数字的身份。&/p&&p&在《Nature》上发表的一篇论文(第一作者是 Cherry)证明,由精心设计的 DNA 序列构成的神经网络可以进行规定的化学反应,准确识别「分子笔迹」。「与几何形状不同的视觉笔迹不同,分子笔迹的每个例子实际上并不具有数字的形状。相反,每个分子数字由从 100 个分子中选出的 20 个独特的 DNA 链组成,每个 DNA 链被指定代表任何 10×10 图案中的单个像素。这些 DNA 链在试管中混合在一起。&/p&&p&Qian 说:「缺乏几何形状在自然分子特征中并不少见,但仍需要复杂的生物神经网络来识别它们:例如,一种独特气味分子的混合物包含一种气味。」&/p&&p&给定分子笔迹的特定例子,DNA 神经网络可以将其分类为九个类别之多,每个类别代表从 1 到 9 的九个可能手写数字中的一个。&/p&&p&首先,Cherry 构建了一个 DNA 神经网络来区分手写的 6 和 7。他测试了 36 个手写数字,而试管神经网络正确地识别了所有数字。理论上来说,他的系统可以将 12000 多个手写的 6 和 7——其中 90 % 取自广泛用于机器学习的手写数字数据库——进行两种可能的分类。&/p&&p&这一过程的关键是用 Qian 和 Cherry 开发的 DNA 分子编码一种「胜者通吃」的竞争策略。在这种策略中,一种特殊类型的 DNA 分子被称为「歼灭者」,用于在确定未知数字的身份时选择获胜者。&/p&&p&Cherry 说:「歼灭者与一个竞争对手的一个分子和另一个竞争对手的一个分子形成复合物,并反应形成惰性、不发生反应的新品种。歼灭者迅速吞噬所有竞争分子,直到只剩下一个竞争者。随后获胜的竞争者被恢复到高浓度,并产生代表网络决策的荧光信号。」&/p&&p&接下来,Cherry 基于其第一个 DNA 神经网络的原理开发了一个更复杂的、可以将 1 到 9 进行分类的神经网络。当给定一个未知的数字时,这种「smart soup」将经历一系列反应并输出两种荧光信号,例如绿色和黄色代表 5,绿色和红色代表 9。&/p&&p&Qian 和 Cherry 计划开发可以学习的人工神经网络,从添加至试管的例子中形成「记忆」。Qian 表明,通过这种方式,该「smart soup」可以被训练来执行不同的任务。&/p&&p&「普通医学诊断只能发现很少的生物分子,比如胆固醇和血糖,」Cherry 说道,「使用我们这种更复杂的生物分子回路,有朝一日诊断测试可能囊括数百种生物分子,分析和反应直接在分子环境中进行。」&/p&&figure&&img src=&https://pic3.zhimg.com/v2-18cc987d5f379a82f22318_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&73& data-rawheight=&24& class=&content_image& width=&73&&&/figure&&p&原文链接:&a href=&https://link.zhihu.com/?target=https%3A//www.sciencedaily.com/releases/.htm& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&sciencedaily.com/releas&/span&&span class=&invisible&&es/.htm&/span&&span class=&ellipsis&&&/span&&/a&&/p&
选自Sciencedaily,参与:张倩、王淑婷。近日,来自加州理工学院的研究人员开发出一种由 DNA 制成的新型人工神经网络。该网络解决了一个经典的机器学习问题:正确识别手写数字。该项研究中,研究者用了 36 个手写数字 6 和 7 作为测试例子,结果表明这种新…
&p&关于这个问题我今天正好看到了这个文章。讲的正是各个算法的优劣分析,很中肯。&/p&&a href=&https://zhuanlan.zhihu.com/p/& class=&internal&&&span class=&invisible&&https://&/span&&span class=&visible&&zhuanlan.zhihu.com/p/25&/span&&span class=&invisible&&327755&/span&&span class=&ellipsis&&&/span&&/a&&p&正好14年的时候有人做过一个实验[1],比较在不同数据集上(121个),不同的分类器(179个)的实际效果。&/p&&p&论文题为:Do we Need Hundreds of Classifiers to Solve Real World Classification Problems?&/p&&p&实验时间有点早,我尝试着结合我自己的理解、一些最近的实验,来谈一谈吧。主要针对分类器(Classifier)。&/p&&br&&p&写给懒得看的人:&/p&&blockquote&&b&没有最好的分类器,只有最合适的分类器。&/b&&/blockquote&&p&随机森林平均来说最强,但也只在9.9%的数据集上拿到了第一,优点是鲜有短板。&/p&&p&SVM的平均水平紧随其后,在10.7%的数据集上拿到第一。&/p&&p&神经网络(13.2%)和boosting(~9%)表现不错。&/p&&p&&b&数据维度越高&/b&,随机森林就比AdaBoost强越多,但是整体不及SVM[2]。&/p&&p&&b&数据量越大&/b&,神经网络就越强。&/p&&br&&h2&近邻 (Nearest Neighbor)&/h2&&figure&&img src=&https://pic2.zhimg.com/50/v2-db981bee29cc0d9494e1cb_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&p&典型的例子是KNN,它的思路就是——对于待判断的点,找到离它最近的几个数据点,根据它们的类型决定待判断点的类型。&/p&&p&它的特点是完全跟着数据走,没有数学模型可言。&/p&&br&&p&适用情景:&/p&&p&需要一个特别容易解释的模型的时候。&/p&&p&比如需要向用户解释原因的推荐算法。&/p&&br&&h2&贝叶斯 (Bayesian)&/h2&&figure&&img src=&https://pic4.zhimg.com/50/v2-6aac3d08de175ee52bba54b_b.jpg& data-rawwidth=&800& data-rawheight=&238& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&https://pic4.zhimg.com/50/v2-6aac3d08de175ee52bba54b_r.jpg&&&/figure&&br&&p&典型的例子是Naive Bayes,核心思路是根据条件概率计算待判断点的类型。&/p&&p&是相对容易理解的一个模型,至今依然被垃圾邮件过滤器使用。&/p&&br&&p&适用情景:&/p&&p&需要一个比较容易解释,而且不同维度之间相关性较小的模型的时候。&/p&&p&可以高效处理高维数据,虽然结果可能不尽如人意。&/p&&br&&h2&决策树 (Decision tree)&/h2&&figure&&img src=&https://pic2.zhimg.com/50/v2-1caf4b378e_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&br&&p&决策树的特点是它总是在沿着特征做切分。随着层层递进,这个划分会越来越细。&/p&&p&虽然生成的树不容易给用户看,但是数据分析的时候,通过观察树的上层结构,能够对分类器的核心思路有一个直观的感受。&/p&&p&举个简单的例子,当我们预测一个孩子的身高的时候,决策树的第一层可能是这个孩子的性别。男生走左边的树进行进一步预测,女生则走右边的树。这就说明性别对身高有很强的影响。&/p&&br&&p&适用情景:&/p&&p&因为它能够生成清晰的基于特征(feature)选择不同预测结果的树状结构,数据分析师希望更好的理解手上的数据的时候往往可以使用决策树。&/p&&p&同时它也是相对容易被攻击的分类器[3]。这里的攻击是指人为的改变一些特征,使得分类器判断错误。常见于垃圾邮件躲避检测中。因为决策树最终在底层判断是基于单个条件的,攻击者往往只需要改变很少的特征就可以逃过监测。&/p&&p&受限于它的简单性,决策树更大的用处是作为一些更有用的算法的基石。&/p&&br&&h2&随机森林 (Random forest)&/h2&&figure&&img src=&https://pic1.zhimg.com/50/v2-5b55bf6ba5b214d4bfcfe5ff_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&br&&p&提到决策树就不得不提随机森林。顾名思义,森林就是很多树。&/p&&p&严格来说,随机森林其实算是一种集成算法。它首先随机选取不同的特征(feature)和训练样本(training sample),生成大量的决策树,然后综合这些决策树的结果来进行最终的分类。&/p&&p&随机森林在现实分析中被大量使用,它相对于决策树,在准确性上有了很大的提升,同时一定程度上改善了决策树容易被攻击的特点。&/p&&br&&p&适用情景:&/p&&p&数据维度相对低(几十维),同时对准确性有较高要求时。&/p&&p&因为不需要很多参数调整就可以达到不错的效果,基本上不知道用什么方法的时候都可以先试一下随机森林。&/p&&br&&h2&SVM (Support vector machine)&/h2&&figure&&img src=&https://pic1.zhimg.com/50/v2-31ad074a36eb42b_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&br&&p&SVM的核心思想就是找到不同类别之间的分界面,使得两类样本尽量落在面的两边,而且离分界面尽量远。&/p&&p&最早的SVM是平面的,局限很大。但是利用核函数(kernel function),我们可以把平面投射(mapping)成曲面,进而大大提高SVM的适用范围。&/p&&figure&&img src=&https://pic4.zhimg.com/50/v2-6f329fd5233c34fbf40a325f1b396ac0_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&p&提高之后的SVM同样被大量使用,在实际分类中展现了很优秀的正确率。&/p&&br&&p&适用情景:&/p&&p&SVM在很多数据集上都有优秀的表现。&/p&&p&相对来说,SVM尽量保持与样本间距离的性质导致它抗攻击的能力更强。&/p&&p&和随机森林一样,这也是一个拿到数据就可以先尝试一下的算法。&/p&&br&&h2&逻辑斯蒂回归 (Logistic regression)&/h2&&figure&&img src=&https://pic4.zhimg.com/50/v2-0bb8543ebe6e74a964b3_b.jpg& data-rawwidth=&300& data-rawheight=&405& class=&content_image& width=&300&&&/figure&&p&逻辑斯蒂回归这个名字太诡异了,我就叫它LR吧,反正讨论的是分类器,也没有别的方法叫LR。顾名思义,它其实是回归类方法的一个变体。&/p&&p&回归方法的核心就是为函数找到最合适的参数,使得函数的值和样本的值最接近。例如线性回归(Linear regression)就是对于函数f(x)=ax+b,找到最合适的a,b。&/p&&p&LR拟合的就不是线性函数了,它拟合的是一个概率学中的函数,f(x)的值这时候就反映了样本属于这个类的概率。&/p&&br&&p&适用情景:&/p&&p&LR同样是很多分类算法的基础组件,它的好处是输出值自然地落在0到1之间,并且有概率意义。&/p&&p&因为它本质上是一个线性的分类器,所以处理不好特征之间相关的情况。&/p&&p&虽然效果一般,却胜在模型清晰,背后的概率学经得住推敲。它拟合出来的参数就代表了每一个特征(feature)对结果的影响。也是一个理解数据的好工具。&/p&&br&&h2&判别分析 (Discriminant analysis)&/h2&&figure&&img src=&https://pic4.zhimg.com/50/v2-768d2edc4926f6fcf3b79_b.jpg& data-rawwidth=&300& data-rawheight=&305& class=&content_image& width=&300&&&/figure&&p&判别分析主要是统计那边在用,所以我也不是很熟悉,临时找统计系的闺蜜补了补课。这里就现学现卖了。&/p&&p&判别分析的典型例子是线性判别分析(Linear discriminant analysis),简称LDA。&/p&&p&(这里注意不要和隐含狄利克雷分布(Latent Dirichlet allocation)弄混,虽然都叫LDA但说的不是一件事。)&/p&&p&LDA的核心思想是把高维的样本投射(project)到低维上,如果要分成两类,就投射到一维。要分三类就投射到二维平面上。这样的投射当然有很多种不同的方式,LDA投射的标准就是让同类的样本尽量靠近,而不同类的尽量分开。对于未来要预测的样本,用同样的方式投射之后就可以轻易地分辨类别了。&/p&&br&&p&使用情景:&/p&&p&判别分析适用于高维数据需要降维的情况,自带降维功能使得我们能方便地观察样本分布。它的正确性有数学公式可以证明,所以同样是很经得住推敲的方式。&/p&&p&但是它的分类准确率往往不是很高,所以不是统计系的人就把它作为降维工具用吧。&/p&&p&同时注意它是假定样本成正态分布的,所以那种同心圆形的数据就不要尝试了。&/p&&br&&h2&神经网络 (Neural network)&/h2&&p&神经网络现在是火得不行啊。它的核心思路是利用训练样本(training sample)来逐渐地完善参数。还是举个例子预测身高的例子,如果输入的特征中有一个是性别(1:男;0:女),而输出的特征是身高(1:高;0:矮)。那么当训练样本是一个个子高的男生的时候,在神经网络中,从“男”到“高”的路线就会被强化。同理,如果来了一个个子高的女生,那从“女”到“高”的路线就会被强化。&/p&&p&最终神经网络的哪些路线比较强,就由我们的样本所决定。&/p&&p&神经网络的优势在于,它可以有很多很多层。如果输入输出是直接连接的,那它和LR就没有什么区别。但是通过大量中间层的引入,它就能够捕捉很多输入特征之间的关系。卷积神经网络有很经典的不同层的可视化展示(visulization),我这里就不赘述了。&/p&&p&神经网络的提出其实很早了,但是它的准确率依赖于庞大的训练集,原本受限于计算机的速度,分类效果一直不如随机森林和SVM这种经典算法。&/p&&br&&p&使用情景:&/p&&p&数据量庞大,参数之间存在内在联系的时候。&/p&&p&当然现在神经网络不只是一个分类器,它还可以用来生成数据,用来做降维,这些就不在这里讨论了。&/p&&br&&h2&Rule-based methods&/h2&&p&这个我是真不熟,都不知道中文翻译是什么。&/p&&p&它里面典型的算法是C5.0 Rules,一个基于决策树的变体。因为决策树毕竟是树状结构,理解上还是有一定难度。所以它把决策树的结果提取出来,形成一个一个两三个条件组成的小规则。&/p&&br&&p&使用情景:&/p&&p&它的准确度比决策树稍低,很少见人用。大概需要提供明确小规则来解释决定的时候才会用吧。&/p&&br&&h2&提升算法(Boosting)&/h2&&p&接下来讲的一系列模型,都属于集成学习算法(Ensemble Learning),基于一个核心理念:三个臭皮匠,顶个诸葛亮。&/p&&p&翻译过来就是:当我们把多个较弱的分类器结合起来的时候,它的结果会比一个强的分类器更&/p&&p&典型的例子是AdaBoost。&/p&&p&AdaBoost的实现是一个渐进的过程,从一个最基础的分类器开始,每次寻找一个最能解决当前错误样本的分类器。用加权取和(weighted sum)的方式把这个新分类器结合进已有的分类器中。&/p&&p&它的好处是自带了特征选择(feature selection),只使用在训练集中发现有效的特征(feature)。这样就降低了分类时需要计算的特征数量,也在一定程度上解决了高维数据难以理解的问题。&/p&&p&最经典的AdaBoost实现中,它的每一个弱分类器其实就是一个决策树。这就是之前为什么说决策树是各种算法的基石。&/p&&br&&p&使用情景:&/p&&p&好的Boosting算法,它的准确性不逊于随机森林。虽然在[1]的实验中只有一个挤进前十,但是实际使用中它还是很强的。因为自带特征选择(feature selection)所以对新手很友好,是一个“不知道用什么就试一下它吧”的算法。&/p&&br&&h2&装袋算法(Bagging)&/h2&&p&同样是弱分类器组合的思路,相对于Boosting,其实Bagging更好理解。它首先随机地抽取训练集(training set),以之为基础训练多个弱分类器。然后通过取平均,或者投票(voting)的方式决定最终的分类结果。&/p&&p&因为它随机选取训练集的特点,Bagging可以一定程度上避免过渡拟合(overfit)。&/p&&p&在[1]中,最强的Bagging算法是基于SVM的。如果用定义不那么严格的话,随机森林也算是Bagging的一种。&/p&&br&&p&使用情景:&/p&&p&相较于经典的必使算法,Bagging使用的人更少一些。一部分的原因是Bagging的效果和参数的选择关系比较大,用默认参数往往没有很好的效果。&/p&&p&虽然调对参数结果会比决策树和LR好,但是模型也变得复杂了,没事有特别的原因就别用它了。&/p&&br&&h2&Stacking&/h2&&p&这个我是真不知道中文怎么说了。它所做的是在多个分类器的结果上,再套一个新的分类器。&/p&&p&这个新的分类器就基于弱分类器的分析结果,加上训练标签(training label)进行训练。一般这最后一层用的是LR。&/p&&p&Stacking在[1]里面的表现不好,可能是因为增加的一层分类器引入了更多的参数,也可能是因为有过渡拟合(overfit)的现象。&/p&&br&&p&使用情景:&/p&&p&没事就别用了。&/p&&p&(修订:&a class=&member_mention& href=&//www.zhihu.com/people/7ca4a0bcfe7ad0bd51e4d& data-hash=&7ca4a0bcfe7ad0bd51e4d& data-hovercard=&p$b$7ca4a0bcfe7ad0bd51e4d&&@庄岩&/a& 提醒说stacking在数据挖掘竞赛的网站kaggle上很火,相信参数调得好的话还是对结果能有帮助的。&/p&&p&&a href=&//link.zhihu.com/?target=http%3A//blog.kaggle.com//a-kagglers-guide-to-model-stacking-in-practice/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&blog.kaggle.com/2016/12&/span&&span class=&invisible&&/27/a-kagglers-guide-to-model-stacking-in-practice/&/span&&span class=&ellipsis&&&/span&&/a& &/p&&p&这篇文章很好地介绍了stacking的好处。在kaggle这种一点点提升就意味着名次不同的场合下,stacking还是很有效的,但是对于一般商用,它所带来的提升就很难值回额外的复杂度了。)&/p&&br&&br&&h2&多专家模型(Mixture of Experts)&/h2&&p&最近这个模型还挺流行的,主要是用来合并神经网络的分类结果。我也不是很熟,对神经网络感兴趣,而且训练集异质性(heterogeneity)比较强的话可以研究一下这个。&/p&&br&&p&&b&讲到这里分类器其实基本说完了。讲一下问题里面其他一些名词吧。&/b&&/p&&br&&h2&最大熵模型 (Maximum entropy model) &/h2&&p&最大熵模型本身不是分类器,它一般是用来判断模型预测结果的好坏的。&/p&&p&对于它来说,分类器预测是相当于是:针对样本,给每个类一个出现概率。比如说样本的特征是:性别男。我的分类器可能就给出了下面这样一个概率:高(60%),矮(40%)。&/p&&p&而如果这个样本真的是高的,那我们就得了一个分数60%。最大熵模型的目标就是让这些分数的乘积尽量大。&/p&&p&LR其实就是使用最大熵模型作为优化目标的一个算法[4]。&/p&&br&&h2&EM&/h2&&p&就像最大熵模型一样,EM不是分类器,而是一个思路。很多算法都是基于这个思路实现的。&/p&&p&@刘奕驰
已经讲得很清楚了,我就不多说了。&/p&&br&&br&&h2&隐马尔科夫 (Hidden Markov model)&/h2&&p&这是一个基于序列的预测方法,核心思想就是通过上一个(或几个)状态预测下一个状态。&/p&&p&之所以叫“隐”马尔科夫是因为它的设定是状态本身我们是看不到的,我们只能根据状态生成的结果序列来学习可能的状态。&/p&&br&&p&适用场景:&/p&&p&可以用于序列的预测,可以用来生成序列。&/p&&br&&h2&条件随机场 (Conditional random field)&/h2&&p&典型的例子是linear-chain CRF。&/p&&p&具体的使用 @Aron 有讲,我就不献丑了,因为我从来没用过这个。&/p&&br&&p&就是这些啦。&/p&&br&&p&相关的文章:&/p&&p&[1]: Do we need hundreds of classifiers to solve real world classification problems.&/p&&p&Fernández-Delgado, Manuel, et al. J. Mach. Learn. Res 15.1 (2014)&/p&&p&[2]: An empirical evaluation of supervised learning in high dimensions.&/p&&p&Rich Caruana, Nikos Karampatziakis, and Ainur Yessenalina. ICML '08&/p&&p&[3]: Man vs. Machine: Practical Adversarial Detection of Malicious Crowdsourcing Workers&/p&&p&Wang, G., Wang, T., Zheng, H., & Zhao, B. Y. Usenix Security'14&/p&&p&[4]: &a href=&//link.zhihu.com/?target=http%3A//www.win-vector.com/dfiles/LogisticRegressionMaxEnt.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&win-vector.com/dfiles/L&/span&&span class=&invisible&&ogisticRegressionMaxEnt.pdf&/span&&span class=&ellipsis&&&/span&&/a&&/p&
关于这个问题我今天正好看到了这个文章。讲的正是各个算法的优劣分析,很中肯。正好14年的时候有人做过一个实验[1],比较在不同数据集上(121个),不同的分类器(179个)的实际效果。论文题为:Do we Need Hundreds of Classifiers to…
&figure&&img src=&https://pic3.zhimg.com/v2-a4fae4fbee20daafa4bd_b.jpg& data-rawwidth=&1024& data-rawheight=&683& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&https://pic3.zhimg.com/v2-a4fae4fbee20daafa4bd_r.jpg&&&/figure&&p&工欲善其事,必先利其器,程序员的日常工作根本就 &b&离 不 开 Chrome 浏览器&/b&!这是因为 Chrome 支持&b&大量扩展插件&/b&,能帮你短时间内完成更多工作,同时比一些 App 消耗更少的系统资源。&/p&&p&&br&&/p&&p&今天要介绍的这些 Chrome 插件,功能有点像星球大战里控制机器人的强制螺栓。因此如果你和千万网民一样经常使用Chrome,以下几个插件可以帮你保持专注。&/p&&p&&br&&/p&&p&用来保持工作专注的&/p&&p&&b&Strict Workflow&/b&&/p&&p&&br&&/p&&p&用过番茄钟的人就会知道,这个简单的Chrome插件背后是个时间管理技巧,但它对不知道这个插件背后设计哲学的人一样有效。基本上来说,就是你工作25分钟,再休息5分钟,然后不断重复直到你的工作完成。&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-36dc144ca7f711ccfcb9124_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&870& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic1.zhimg.com/v2-36dc144ca7f711ccfcb9124_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&虽然没有严格按照“番茄”来命名,但strict workflow这个插件强化了番茄工作法。当你使用它时,一个“黑名单”里的网站会在25分钟内被阻止访问,期间你无法解锁这些网站,除非完全禁用该插件。这个插件预装了一些可能使你分心的网站,比如Facebook和YouTube。&/p&&p&&br&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//chrome.google.com/webstore/detail/strict-workflow/cgmnfnmlficgeijcalkgnnkigkefkbhd& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&chrome.google.com/webst&/span&&span class=&invisible&&ore/detail/strict-workflow/cgmnfnmlficgeijcalkgnnkigkefkbhd&/span&&span class=&ellipsis&&&/span&&/a&&br&&br&&/p&&p&&br&&/p&&p&用来保持工作专注的&/p&&p&&b&StayFocused&/b&&/p&&p&&br&&/p&&p&这个插件工作模式和Strict Workflow差不多,但不那么蛮干。你可以用它来定制你在何时可以访问什么网站。&/p&&p&&br&&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-bdfcb5146edfeafa0d6e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&892& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic4.zhimg.com/v2-bdfcb5146edfeafa0d6e_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&相比其他网站屏蔽应用,该插件的使用体验更有弹性,因为它允许你选择让自己访问特定站点的时长。当你用完了许可时间,网站就会被屏蔽,你也就访问不了。&/p&&p&&br&&/p&&p&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//chrome.google.com/webstore/detail/stayfocusd/laankejkbhbdhmipfmgcngdelahlfoji%3Fhl%3Den& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&chrome.google.com/webst&/span&&span class=&invisible&&ore/detail/stayfocusd/laankejkbhbdhmipfmgcngdelahlfoji?hl=en&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&用来计划工作的&/p&&p&&b&Toggl&/b&&/p&&p&&br&&/p&&p&除了简单地让你没法逛网页,有些应用被设计用来帮你统计花在浏览特定网页上的时间。Toggl 是最受欢迎的此类应用之一,因为它向你的Chrome浏览器添加了计时器,让你能有效地为自己的工作计划计时。&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-f21eabbe2953_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&909& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic1.zhimg.com/v2-f21eabbe2953_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&在市面上所有的计时类应用当中,Toggl是比较不那么工作导向的那种,但也比其他的要更复杂。免费版有基本的计时功能,但没有产品或团队管理机能。但它仍然能让你记录花在特定任务上的时间,在确保自己不做无用功方面很有帮助。&/p&&p&&br&&/p&&p&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//chrome.google.com/webstore/detail/toggl-button-productivity/oejgccbfbmkkpaidnkphaiaecficdnfn& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&chrome.google.com/webst&/span&&span class=&invisible&&ore/detail/toggl-button-productivity/oejgccbfbmkkpaidnkphaiaecficdnfn&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&用来管理时间的&/p&&p&&b&timeStats&/b&&/p&&p&&br&&/p&&p&如果你对主动为浏览网络行为掐秒表没兴趣——就像我,跳动的秒表对我来说就像猫咪可爱视频一样令人分心——那你可以下载timeStats,不必看着表也能获取自己的时间管理信息。&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-04ade84a840ad_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1024& data-rawheight=&490& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&https://pic4.zhimg.com/v2-04ade84a840ad_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&它能帮你找出自己的弱点,这对订制自己个人工作计划的自由职业者特别有帮助。举个例子,如果你发现自己工作时刷微博的时间有点太多了,那你就可以下载上述的禁网插件来帮自己抵抗诱惑。&/p&&p&&br&&/p&&p&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//www.microsoft.com/en-us/p/timestats-planner-10/9nblggh6jk7c& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&microsoft.com/en-us/p/t&/span&&span class=&invisible&&imestats-planner-10/9nblggh6jk7c&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&用来防沉迷的&/p&&p&&b&Block Site&/b&&/p&&p&&br&&/p&&p&你可能已经注意到了,前面那些插件都致力于拉黑特定网站。但网络的优点和缺点都是访问的简便性,哪怕那些网站你不该去看。通过提前在整块工作时间里“预防性”拉黑网站的功能,Block Site能帮你与沉迷维基百科的冲动斗争。&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-e0bbfeabc4b376_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&918& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic1.zhimg.com/v2-e0bbfeabc4b376_r.jpg&&&/figure&&p&&br&&/p&&p&&br&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//chrome.google.com/webstore/detail/block-site-website-blocke/eiimnmioipafcokbfikbljfdeojpcgbh%3Fhl%3Den& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&chrome.google.com/webst&/span&&span class=&invisible&&ore/detail/block-site-website-blocke/eiimnmioipafcokbfikbljfdeojpcgbh?hl=en&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&不用打开收件箱就能看邮件的&/p&&p&&b&Checker Plus&/b&&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-fa234104bfc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&690& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic2.zhimg.com/v2-fa234104bfc_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&&br&&/p&&p&同时处理3个gmail邮箱里的邮件没什么太大意义,我也干不了这活。而Checker Plus就能让我在浏览器工具栏看到所有消息以及回复,同时留有删除和归档它们的功能,减轻了我的负担。&/p&&p&&br&你可以选择接收有声消息通知,设置工具栏按钮为打开收件箱,用键盘快捷键快速分类堆满的邮件等等 - 所有这一切都不用离开你现在手头在干的活。对了,你也可以选择一个自定义主题来个性化设置。很快,你再也不用看你的收件箱了。&/p&&p&&br&&/p&&p&装载地址:&a href=&https://link.zhihu.com/?target=https%3A//chrome.google.com/webstore/detail/checker-plus-for-gmail/oeopbcgkkoapgobdbedcemjljbihmemj& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&chrome.google.com/webst&/span&&span class=&invisible&&ore/detail/checker-plus-for-gmail/oeopbcgkkoapgobdbedcemjljbihmemj&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&用白噪音提高专注度的&/p&&p&&b&Noisli&/b&&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-b89f3acb518af_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&312& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-b89f3acb518af_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&p&由于工作风格的关系,你可能喜欢放

我要回帖

更多关于 布防密码 的文章

 

随机推荐