第十届机器学习和计算国际会议好中吗

&&&首页&&&&&&征文范围&&&&&&会议安排&&&&&&&&&&&&&&&&&&&&&&&&
Copyright &2007 - ki.net
Powered By2017年第九届机器学习与计算国际会议(ICMLC 2017) 地点:新加坡 时间: 08:00:00 至
(时间: 地点:上海 上海绿地万豪大酒店)
参会人信息
2017 9th International Conference on Machine Learning and Computing (ICMLC 2017) will be held during February 24-26, 2017 in Singapore, organized by ASR.
ICMLC aims to provide a high level international forum to bring together industry professionals, academics, and individuals from institutions, industrials and government agencies to exchange information, share achievements, and discus the advancement in the fields of Machine Learning and Computing, etc.
Welcome Prof. David Greenhalgh, Assoc. Prof. Chi-Chang Chang and Prof. Tetsuya Sakurai will deliver keynote speech in ICMLC 2017.
主办方:科学文化交流协会
The Full-length Presentation Program Copy will be online in Jan, 2017...
Please Kindly Wait...
When You Present the Conference
Arrival&Registration (1st Day )
The first day is all about registration, participants are supposed to sign in at the conference venue and collect all the conference materiails at the registration counter on this day.
However, the registration is still open on the 2nd day of the conference.
Openning Remarks&Keynote Speech (2nd Day morning)
The conference chair will host an opening ceremony in the morning, and all the participants are supposed to be there, then the keynote speakers will deliver their spectacular speeches and share their cutting-edge research fruits with the participants. During the intermission, there will be a photo session for all the participants to take a group photo.
Lunch (2nd Day noon)
Author Presentation in Sessions (2nd Day)
Participants' presentations are divided into different sessions based on the conference topics, participants should find the right session room and be there at least 3 minutes earier to copy his ppt/pdf presentation into the laptop and get ready. Then the session chair will start to chair the seesion on time and give a grade to each presentation, which should be within 15 minutes, including Q&A.
Dinner (2nd Day evening)
One Day Tour (3rd Day)
西南交通大学
David Greenhalgh
University of Strathclyde
Simon Fong
中国澳门大学
美国丹佛大都会州立大学
新加坡南洋理工大学
ItemsRegistration Fee (By US Dollar)Author (ASR Member)?
400 USDAuthor (Student)?400 USDAuthor (Regular)?450 USDPresenter Only300 USDListener280 USDAdditional Paper(s)??300 USDAdditional Page50 USD/One PagePurchase Extra Journal60 USD?One regular registration can cover a paper within Five pages, including all figures, tables, and references. ??One regular registration with one or more additional papers has only ONE journal book.Author: making a presentation of the paper which will be published by the proceedings/journals.Presenter: making a presentation on the conference without any paper publishing.Listener: Participating in the conference only without neither presentation nor paper publication.For Presenter & Listener Registration, please download . For Presenter, please email the abstract of presentation paper to us firstly.Author Registration fee includeds:Listener and Presenter Registration Fee includes:1. Full-length Paper being Published in journal and Indexing Services2. Conference document (Proceedings)3. Participation in the Technical Program1. Participation in the Technical Program2. Conference proceedings (CD) If You Present, You can also Have:If You Present, You can also Have:10-15 mins for PresentationBadgeCertificate of ParticipationConference bag and/or conference accessoriesLunchDinnerCoffee breaks10-15 mins for Presentation (Presenter Benefit)BadgeCertificate of ParticipationConference bag and/or conference accessoriesLunchDinnerCoffee breaks
会议场地:NanyangExecutiveCentre
全部留言(0)
部分参会单位
主办方没有公开参会单位
会议演讲赞助
邮件提醒通知
您可能还会关注
扫一扫立即购票 安全·方便·快捷
下载活动家app 随时随地查看国内商务会议 了解行业动态
关注活动家公众号 了解更多会议资讯
更多会议问题
请联系活动家客服
分享到微信 ×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。
免注册,使用合作网站登录
QQ 微信 微博
活动家介绍:
找会议,上活动家!活动家是亚洲的会议活动查询、报名、票务营销平台,致力于为用户提供有价值、有意义的商务会议活动,以及为主办方提供会议免费发布、活动推广营销,视频直播,在线选座等服务,是你参会、办会的好助手。
热门关键词:
,蜀ICP备号-1 增值电信业务经营许可证编号川B2-摘要:国际机器学习大会(ICML)源于1980年卡内基-梅隆大学举办的机器学习研讨会,如今已发展为国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,代表机器学习学术界最高水平。大数据时代,ICML又有什么看点?
国际机器学习大会(ICML)源于1980年在卡内基-梅隆大学(CMU)举办的机器学习研讨会。几十年过去了,ICML如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,可以说代表了当今机器学习学术界的最高水平。那么,在&大数据&时代的背景下,ICML又有什么看点呢?今年,第三十届国际机器学习大会(ICML 2013)于6月16-21日在美国亚特兰大举行,下面我与各位读者一起分享一下我的参会感想。
可扩展的大规模图学习与推断算法
可扩展性(Scalability)可谓是贯穿今年ICML的一大主线。首先,什么是可扩展性?通俗的说,就是让传统的机器学习算法能够适应并处理海量数据(如上百亿级别的文件)。在结构化数据普遍存在的今天,可扩展的图算法,尤其是可扩展的复杂概率图算法尤其引人注目。到底实现可扩展的图结构算法有什么困难?一个显而易见的难点就在于:数据样本之间往往有较强的依赖性,所以MapReduce这种对数据进行&分割-计算-合并&处理的传统数据并行化方法可能并不直接适用于图结构的并行化。
在ICML开幕前一天的结构化学习研讨会上,Facebook数据科学家Jonathan Chang就介绍了他们面临的实际问题:Facebook的在线社交网络有大约109个结点(用户),以及大约1012条边(关系)。 在这种规模的图结构里,就算仅仅是计算所有用户好友的好友(Friends of Friends)这一简单属性,如果不使用高效的图计算模型,也可能产生庞大的开销和非最优的结果。Jonathan接着介绍了他们的解决方法:Giraph,一种基于图灵奖得主Leslie Valiant在20世纪80年代推出的Bulk Synchronous Parallel(BSP)模型衍生而来的开源工具。Giraph其实可以被看成是近年来Google Pregel迭代计算模型的开源版本:在这个以结点为中心的模型的每次迭代计算中,结点处理上次收到的消息,发送消息给其他结点,并且改变自身结点、边或者拓扑结构。当Jonathan被问到与GraphLab的对比时,他表示Facebook曾经尝试过GraphLab,但并不能达到他们的需求。非常有意思的是,Carlos Guestrin正好将在本次ICML大会上做关于GraphLab最新进展的主题报告。
第二天一早,会场早已座无虚席。ICML大会主席Michael Littman简短介绍后,Carlos Guestrin这位机器学习的新生代领军人物就正式登台了。说到GraphLab,相信大家不会过于陌生:GraphLab三年前诞生于CMU机器学习系,主要目的是为了并行化复杂的图算法。
Carlos接下来介绍了他们开发GraphLab的心路历程:早期推出的第一代GraphLab,在许多任务中取得了非常惊人的表现。如GraphLab1对于Never-Ending Language Learning(Tom Mitchell的永不停息机器学习系统)的CoEM算法的并行化实验,所需时间仅仅是Hadoop的0.3%。然而,GraphLab1在处理14亿结点、67亿条边的Altavista数据集上失败了。为什么呢?在分析了数据后,他们发现Altavista服从自然图的Power Law分布属性,即有1%的结点与53%的边相连,而这些高度数的结点会导致他们原先的算法失效,并且使得图结构很难被分割。同时,他也介绍了Pregel的问题,由于Pregel/Giraph是同步类算法,很多情况效率也不如非同步算法,在自然图上也会发生此类问题。2012年推出的GraphLab2对自然图计算的瓶颈问题进行了改进:通过把计算迁移到数据上,他们设法并行化高度数的结点,并且设计了有效的适应自然图Power Law分布的图分割算法。如今,GraphLab2在处理Altavista的数据上已经有了重大突破,使用1024个核与4.4TB的内存,现在只需要11分钟的处理时间。最后,Carlos介绍了GraphLab3的规划:GraphLab3将结合第一代的代码可读性与第二代强大的可扩展性特点,使得图并行算法能被更多的开发者所使用。另外值得注意的是,如今GraphLab已正式注册了公司,并且获得了675万美元的风险投资。
深度学习热潮的延续
随着深度学习概念的兴起,本届ICML自然也是少不了许多关于特征学习以及深度神经网络的工作。由于深度学习的学术界领头人Geoffrey Hinton老先生已归顺了Google,所以加拿大蒙特利尔大学的Yoshua Bengio教授在本次大会中显得非常活跃。首先在6月16日的研讨会上,Yoshua介绍了他近期一些较为&激进&的思想:他认为传统的隐变量概率图模型在实际使用中会产生很多的局部最优区域,这些局部最优区域甚至可能会超过经典马尔科夫链蒙特卡洛(MCMC)推断算法的采样次数,最终导致得到非优的推断结果。Yoshua提出,传统的隐变量模型可以被Denoising Autoencoders(DA)替代。DA可以被看作是一种生成式深度学习模型(generative model),并可使用任意的变量(离散或连续)、任意的噪音,以及任意的损失函数。Yoshua最新研究成果表明,DA不仅在输入层,在中间计算层也可以加入噪音建模。他认为此算法可以用经典的反向传播算法训练参数,从而克服显式传统隐变量模型的缺点。在6月17日的大会上,Yoshua还有一项有意思的工作就是介绍Recurrent Neural Networks训练过程中梯度(gradient)的消失与爆炸(过大)现象。其实梯度的突然消失与爆炸在各类随机梯度下降算法中普遍存在,也是一个优化中常见的问题。他们解决的方法是将爆炸的梯度重新规整,并且将消失的梯度正则化。
6月19日,Google语音搜索组Vincent Vanhoucke做了关于深度学习在语音识别中应用的精彩主题演讲。Vincent从语音的基础(声学模型与语言模型),堪称经典的高斯混合模型-隐马尔科夫模型,语者适应技术,讲到如今基于深度学习的语音识别。深度学习在语音学习的应用源自一个跨领域的经典合作:故事是2010年前后,微软和Google的语音组分别招了Hinton老先生的几个学生做实习,结果发现如果不用传统的MFCC/PLP特征,而用深度学习直接从语音信号里学习特征,并且用深度学习技术对声学模型建模,居然可以在标准数据集TIMIT上取得惊人的突破。以Google为例,3个月时间下来,语音搜索的相对错误率竟然减少了10%。Vincent介绍说,其实语音识别对神经网络并不陌生,早在20世纪80年代末与90年代,神经网络就在语音及音素识别上有了应用,但基于当时算法和硬件的限制,并没有被广泛采纳。随后神经网络在语音世界里消失了近10年,直到2010年前后的深度学习热潮,才重新回到人们的视野里。
还有一个不得不提的就是斯坦福大学Andrew Ng关于用GPU做深度学习的最新工作。还记得Google曾经用1000台计算机(开销约100万美元)做的猫脸识别软件吗?在本次ICML中,Andrew的学生仅用价值2万美元的GPU集群,就做到了相同的准确率。可以说,Andrew的这项GPU技术,使得深度学习技术逐步走向中小公司及学校,又迈进了一大步。同时,在6月21日的迁移学习研讨班中,Andrew还通过Skype视频远程与我们进行了沟通,介绍了斯坦福大学深度学习项目的研究进展,尤其是在计算机视觉上的应用。另外,在ICML的讲习班里,另一位深度学习的领路人,纽约大学的Yann LeCun教授也做了一个长达3小时的深度学习教学讲座,受到了各位听众的好评。
Andrew Ng在ICML迁移学习研讨会上做关于深度学习的远程演讲
其他机器学习热点问题及最新进展
本年度ICML的经典论文奖颁给了10年前(ICML 2003)两篇来自CMU的论文:第一篇论文是Jerry Zhu、Zoubin Ghahramani以及John Lafferty关于图结构半监督学习的经典论文。如果你关心机器学习的进展,不难发现,用半监督或无监督学习方法挖掘无标签的数据,不仅是过去10年,还很可能是大数据时代的一个热点。另外一篇是Martin Zinkevich的在线学习经典论文。在线学习解决的问题是:当数据集太大,并且数据流速度太快的情况下,我们没有理由每次都把所有数据全部重新训练一遍。通过在线学习方法,我们可以不用把数据存在硬盘里,每次直接用实时的数据流来更新机器学习模型的参数。另外,ICML 2013最佳论文奖之一授予了Vanishing Component Analysis。传统的特征选择方法通常是在采样中选择显著的特征,这篇论文研究的是,在特征选择时,能不能选择一些不变的特征呢?在特征选择的问题中,这也是一个比较新的研究方向。
如果你是Dave Blei的粉丝或者对文本分析有兴趣,ICML 2013也有相当多有意思的主题建模文章,例如Arora等人推出的基于锚点词(anchor words)的主题建模新算法,Ke Zhai等人的无限词汇维度在线LDA模型,以及Weicong Ding等人推出的基于投影方法的主题模型,这些都让人眼前一亮。
核函数领域的专家Alex Smola在ICML上介绍了一种名为Fastfood的核函数计算方法,使得计算核函数的时间和空间复杂度分别降到了O(nlogd)与O(n)。这对广大的基于非线性核函数的SVM应用来讲,绝对是一个大救星。
最后还有就是概率编程(probabilistic pro&gramming):虽然本次大会关于概率编程的研究不多,但其日前被DARPA认为是机器学习的未来。概率编程的主要思想就是对确定性编程语言概率化,使得不具备机器学习专业背景的程序员也可以用简单的程序语言与规则来从数据中学习规律,对未知世界进行预测。IMLS主席William Cohen教授与我分别在16日与20日的研讨班上简单介绍了新发明的高效概率化Prolog语言ProPPR:通过几行简单的逻辑编程,可以在复杂的图结构上进行快速的推断,并且实现统计关系推断、分类、实体消歧、序列预测等多种任务。
作者在ICML研讨会上介绍概率编程的最新进展(拍摄者:Cheng Zhang)
通过本次大会,我们不难发现,随着大数据时代的来临,机器学习领域也正在悄然积极应对。值得一提的是,ICML 2014将于明年的6月21-26日在中国北京举行,届时中国的机器学习爱好者将有机会在家门口享受一场机器学习的饕餮盛宴。
本文作者王威廉,毕业于哥伦比亚大学,目前在CMU攻读博士。曾供职于微软总部研究院、哥大工学院、南加州大学。ACL、CIKM、COLING、Interspeech等知名国际会议上发表论文20余篇,并担任多家SCI杂志的审稿人。2011年被CMU校长选为R. K. Mellon Presidential Fellow。
阅读(...) 评论() &【第十届中国R会议(合肥)通知】【机器学习吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:9,736贴子:
【第十届中国R会议(合肥)通知】收藏
一、会议简介2017年,中国R会议已走过十载春秋。在这样一个值得纪念的年份,R语言也将来到四大科教名城之一的合肥。中国科学技术大学管理学院、中国科学技术大学国际金融研究院和统计之都,将携手在合肥主办第十届中国R会议(合肥)。我们诚邀学术专家、业界精英和技术大咖同台交流,分享您与数据科学的那些事儿,共赴R会议十年之约。中国R会议是由统计之都发起,并同国内高校共同举办的R语言与数据科学会议。自2008年在中国人民大学举办第一届起,中国R会议已先后在全国七个城市举办,影响也日渐扩大,前后报名参与人数已过万人。会议内容覆盖数据科学及R语言在各行各业的应用,包括天文、地理、医疗、生物、金融、能源、互联网等领域。 十年磨一剑,破鞘天下惊。R会议发展壮大的同时,统计之都也已走过十年风雨。十年间,统计之都服务着广大统计学爱好者,推动着R语言在中国的传播发展,见证着数据科学时代的逐渐崛起。迄今,统计之都已先后出版八本图书,举行海内外沙龙五十余期;未来,我们将再接再厉,继续为国内统计学和数据科学发展贡献自己的力量。二、会议时间及地点时间:日~18日地点:中国科学技术大学西校区(具体会场地址请留意网站更新)三、会议主题本届分会议的主题包括但不限于:医疗健康、生物信息、消费金融、量化投资、工业工程、智能制造、软件工具、计算平台、概率统计、机器学习、人工智能、自然语言、天文地理、城市规划、环境科学、社交网络、政务数据、商务统计、人文社科等诸多话题。四、会议赞助本次大会欢迎企业、高校以及个人以合适的形式提供赞助,主办方将提供包括在会议手册上印制赞助商介绍、为赞助商提供报告演讲机会等在内的多种权益。具体赞助事宜请与会务组讨论商定,联系邮箱sponsor@cos.name。五、演讲者报名大会除了邀请嘉宾演讲之外,也欢迎报名演讲。主题包括但不限于金融与金融大数据、统计与机器学习、业界应用与数据可视化、自然语言与软件工具等。欢迎有兴趣的演讲者将个人简介、二寸照片、演讲题目、演讲摘要(200字左右)邮件发送至chinar-2017-hf@cos.name。大会组委会将对报名的演讲择优录用。演讲者报名截至日期为日。六、参会者报名在线报名已经开放,请点击下方阅读原文报名(或点击:)。请务必用A4纸打印门票,进入会场时候需要凭纸质票进入!此外,请务必保证您的门票上的名字和身份证或者护照上的名字完全一致,以免无法进门。报名审核只是为了确认报名者身份的真实性。本次会议不收取任何费用,交通、食宿等花费自理。为会议参会者(以在线报名结果为依据)免费提供会议材料,请报名的朋友们尽量前往参会。七、主办方及协办方介绍中国科学技术大学管理学院中国科学技术大学管理学院创办于1995年6月成立(原名为中国科学技术大学商学院)。学院下设工商管理系、管理科学系、统计与金融系,以及MBA、EMBA专业学位教育中心和EDP高层管理者培训与发展项目中心,构建了高质量的统计学、管理科学与工程和工商管理三个一级学科人才培养和科研体系,同时设有决策科学实验室、统计研究所等有影响力的研究机构。学院已经通过AACSB(国际精英商学院协会)认证和AMBA国际认证,系全球首家按照AACSB最新标准获得认证的单位。学院致力于成为国内乃至国际科技教育双一流的商学院,创造体现国际水平、中国情景、国家需求的一流成果,培养数理基础扎实、思维创新、具有全球视野和社会责任的管理与科研人才。中国科学技术大学国际金融研究院中国科学技术大学国际金融研究院是中国科学技术大学为贯彻落实世界一流大学战略而创建的新型金融类商学院,是由合肥市和中国科大务实合作的典范。研究院位于合肥市滨湖国际金融后台服务基地的核心位置,将以金融、大数据、国际化于学科交叉为抓手,汇聚一流师资,引进前沿金融创新理念,培育高端金融人才,建设金融创新创业平台,形成国内金融顶级智库,打造国内一流、世界知名的国际金融研究院。统计之都统计之都(Capital of Statistics,简称COS,网址 ),成立于2006年5月,是一家旨在推广与应用统计学知识的网站和社区,其口号是“中国统计学门户网站,免费统计学服务平台”。统计之都发源于中国人民大学统计学院,由谢益辉创建。现由世界各地的众多志愿者共同管理维护,理事会现任主席为冯凌秉先生。统计之都致力于搭建一个开放的平台,使得科研人员、数据分析人员和统计学爱好者能互相交流合作,一方面促进彼此专业知识技能的增长,另一方面为国内统计学和数据科学的发展贡献自己的力量。七、联系方式组委会主席:林枫会议主页: 会议微信:统计之都新浪微博:@统计之都微信公众号:统计之都邮箱:chinar-2017-hf@cos.name
登录百度帐号推荐应用机器学习研究和应用&近期热点集锦
机器学习研究和应用 近期热点集锦
写在最前:
龙星计划是一个很赞的课程,之前断断续续听过几次关于机器学习和数据挖掘的课, 受益匪浅。 为了让更多人受益于该课程,
便维护了@这样一个weibo平台,以方便更多人(特别是青年学子)获取本课程的相关讯息。近几个月来,
大家热情高涨,反馈很多,一个主要的问题就是想了解到更多更前沿的机器学习进展。为此,特将自己整理的这份列表分享给大家,希望对您有所帮助。
会议动态:
l @李航博士:Machine Learning Summer School
将于2014年在北京举行。
l @李航博士: 人工智能国际大会 IJCAI 2013
将于明年8月在北京举行。 关注!
l @老师木:第十届中国机器学习及其应用研讨会MLA2012将于11月3、4日在清华大学召开。
International Conference on Data Mining)
ICDM-2013将会在美国DALLAS召开,
我是大会程序委员会主席 (PC Co-chair).
希望大家帮助转载, 并欢迎数据挖掘人士踊跃投稿.
的投稿截止日是10月20日。会议请了3个很好的keynotes: H.V. Jagadish (DB), Mark Sanderson
(IR), and Dan Suciu (DB)。
: ICDE 2013
call-for-participation 刊登在本期IEEE Data Engineering
Bulletin上了
puter.org/debull/A12sept/icde2013.pdf
欢迎明年4月来布里斯本!ICDE的审稿就要结束了,错过这个机会的同事们还可以考虑ICDE
Workshops和APWeb
(截稿日期延迟至10月20日了)。
: 于2012年09月21日14:00-17:00在中国科学院计算技术研究所一层报告厅举行,敬请光临。本期报告会主题:新一代视觉感知技术及应用。特邀讲者:
吴飞 嘉宾嘉宾
学术会议WAIM2013的Call For
Demo(2月20日截稿)和Call For
Workshop(12月23日截稿)出来了。本次的Demo
Session将设Best
Demo奖项。请大家广而告之!北戴河哦!
: NIPS 2012
ACCEPTED PAPERS:
KDD Summer School on Mining the Big
Data在清华举行。这是KDD第一次办暑期学校,共同主席为人大信息学院杜小勇院长、华为李航博士和我。今天三位讲课者为Jiawei
Han(UIUC)、Christos Faloutsos(CMU)和Bing
Liu(UIC),每人讲2小时。300余座位座无虚席,一些人席地而坐。PPT下载:
明年的DASFAA会将于2013年4月22-25在武汉召开。论文提交截止日期是10月28日(摘要是10月21日)。我和清华大学的冯铃是PC
Co-Chair,为大家服务。请踊跃投稿。
会议总结:
SIGIR2012会议基本结束了。几点收获:ranking已成为一个基本问题,与其他application结合的趋势越来越明显,例如recommendation,query
suggestion等。同意
的观点,IR发展遇到瓶颈,无论从theory或application的角度,需要新的观点视角以及研究思想的指引。个人认为machine
learning亦然。
l @龙星计划:kdd2012会议总结
算法讨论:
说一句,为什么说PLSA的贡献更大。没有prior加个prior,属于定式思维。而在传统文本分类或聚类模型上,一个文章一topic,提出
document-&topic-&word的sampling
从而一个文章可以有多个topic,这是开创性的。Hofmann做了PLSA后,就一骑绝尘,玩别的去了,而Blei同学十年后还在玩topic
: 由于训练deep
network需要大量的语音数据和强大的计算资源,几乎只有微软,Google,IBM的研究人员可以染指。我不禁有个问题
- 以后高校在需要大数据训练的领域,如何开展研究?
很多的有关SVM的教科书都misleading:
(1) KKT条件,support vectors, quadratic
programing都是浮云;(2)
kernel本身对理解学习问题有帮助,但实际工程上用处为0;(3)
loss只是众多可选项之一,logistic效果一点不差。最近给团队下了死命令
- 永远不许用RBF这些infinite
应用动态:
【科大讯飞获国际英文合成大赛七连冠】讯飞在智能语音技术国际赛场又传捷报,再次夺得国际英文合成大赛(Blizzard
2012)冠军并囊括了相似度、自然度、可懂度及段落表达等所有关键评测指标的第一名。这已是自2006年起第七次蝉联该项赛事桂冠,持续巩固了讯飞智能
语音技术的全球领先地位。
谷歌Scholar又出新招,推出My
updates功能(文献推荐),只要你在Scholar
Citation中建立个人学术档案,谷歌就可以通过分析你发表过的文章,从而为你推荐你的研究方向中最新的文章,强烈推荐广大科研爱好者使用。
成为历史上卖的最快的电子设备之一,同时也改变了很多人对 computer vision
的看法:之前,computer vision
很难,进展缓慢,而且很多人认为没什么用处,但是 kinect 的出现,让
computer vision 大有用武之地!
基础研究总是会有用处的,需要一个巧妙的产品理念来放大
【传谷歌正在开发互联网免登录技术】谷歌软件开发者Tim
Bray在博客透露,谷歌正在开发一种互联网免登录技术,使用户在跨网站浏览时无需注册和登录。Tim表示,他目前的职责是“减少网民频繁登录各网站的痛苦”,以实现用户登录“变得简单”或者“完全消失”的长期目标。(新浪科技)
小宇宙就要爆发了:Google的虚拟人脑即将投入使用 |
今年6月,Google的虚拟人脑技术在AI领域树起了里程碑—无需预先输入概念,机器能自动从图片中找到猫的图像,十分类似人脑视觉皮层的功能。机器模拟人脑已有苗头,大家是恐惧还是兴奋呢?
【Swivel虚拟试衣间:瞬间百变】在今年纽约时尚周中“Swivel虚拟试衣间“吸引了众人的目光.对于虚拟试衣应用,人们已期待许久.
如今在Kinect的帮助下,终于变成了现实.站在虚拟展柜前,顾客只需动动手指,就能看到所有服饰的上身效果!这免去了来回更衣的麻烦,既省时又省力,
一起先睹为快&&
推出北京大学可视化研究组的第二个微博可视化工具 PKU Weibo Visearch.
提供针对关键词的微博搜索,并以可视化的形式提供。可以选择不同时间段的微博,看到相关微博內容的变化。目前显示最近的150条微博,速度比较慢一点,后续将逐渐改进。欢迎多提意见!
最近组内同学做了一个微博关键词功能:“揽悦图书推荐”,可以根据用户微博内容分析你的阅读兴趣,推荐可能感兴趣的图书,还请各位老师、同学、好友试用,提出意见和建议。改进后我们将尽快正式推出该功能。
揽悦网址:
腾讯朋友网和腾讯研究院对120所高校、超过100万张真实头像进行了信息采集和数据分析,最终依据五官等平均数值产生了120所学校的“平均相貌”,即高校大众脸,中央音乐学院、电影学院、舞蹈学院瞬间甩开一众苦逼985学校。
资料共享:
l @老师木:MLSS2012涉及Statistical Learning Theory、Probabilistic Topic
Models、Statistical Relational Learning、Kernel
Methods、Boosting、Convex Optimization等 sildes下载。
昨天微软研究院的周登勇访问百度,做了一个精彩的技术报告“Learning from the Wisdom
of Crowds by Minimax Entropy
(最小最大熵方法学习群体智慧)“, 一个很漂亮的机器学习框架解决一个现实问题
如何从含噪众包结果中获得数据的真实标注,很有启发。请关注他的NIPS012文章。
: 序列数据挖掘大牛Eamonn
Keogh在2011 AAAI的报告:Machine
Learning in Time Series Database。推荐一读: Everything is a time
series!(万物皆时序)
本周四讨论班起,吴老师开始介绍《统计学习基础(The Elements of Statistical
Learning)》,开始时间13:15分,持续一小时左右,每周一次,地点在张江Z2303教室,欢迎旁听。
l @老师木:Learing for the Web: Koby Crammer、Jason Eisner、Noah
Smith、Slav Petrov等横跨ML和NLP的牛人们深入浅出地介绍自然语言处理里中的机器学习算法,讲义下载。
正态分布的前世今生。
: 推荐Lisbon
Machine Learning School的网站:。Koby
Crammer、Jason Eisner、Noah
Smith、Slav
Petrov等横跨ML和NLP的牛人们深入浅出地介绍自然语言处理里中的机器学习算法,讲义可以免费下载。
明天下午要给新一届研究生讲Topic Models的ppt
融合了Jason
Eisner 2011年在葡萄牙的Summer School on Machine
Learning上Bayesian Generative
Modeling的内容,还有Edwin
Chen的一篇blog,教父Blei的一些slides内容,当然还有前两年自己做的版本的内容。
伯克利大学“机器学习(Practical Machine
Learning)”课件及相关资料
: 全部上线了,共六讲,每讲一小时:一、互联网的未来十年;二、人类社会化行为;三、现实世界的社会行为分析;四、社会化网络对现实社会化行为的影响;五、社会化网络中的社会行为分析;六、社会化网络产业结构与业务模式剖析。多谢
大力支持!
ICML 2012的论文可以下载啦:
KDD2012的录像(包括keynote,
paper、panel):
小编强烈推荐Stanford的CS246课程——Mining
Massive Data Sets。
新鲜出炉的2012年冬季课程PPT和参考书一应俱全:
之前微博有推荐过Mining of Massive
Datasets这本电子书,这次推荐的是新的课程Slides。
Talk on Experiences and Lessons in Developing Industry-Strength
Machine Learning and Data Mining Software by Chih-Jen Lin:
Tutorial on Graphical Models at KDD 2012 by Professor Xiaojin
(Jerry) Zhu:
tutorial: Factorization Models for Recommender Systems and
Other Applications
刚刚把昨天在KDD2012上所做的关于learning to rank
for search and
advertising的ppt放在了我的主页上,有兴趣的同学可以下载:
: Deep Learning
for NLP (without Magic) & ACL 2012 Tutorial & 相关视频及课件
& 我爱公开课
(分享自 )
KDD Summer School on Mining the Big
Data在清华举行。这是KDD第一次办暑期学校,共同主席为人大信息学院杜小勇院长、华为李航博士和我。今天三位讲课者为Jiawei
Han(UIUC)、Christos Faloutsos(CMU)和Bing
Liu(UIC),每人讲2小时。300余座位座无虚席,一些人席地而坐。PPT下载:
自然语言处理及计算语言学相关术语中英对译表,好几页,需要的童鞋不要漏掉了哦!
: 维护了近三年的列表在新地址继续更新,跟进到12年的ACL和EMNLP,欢迎大家继续关注~
Richard Socher, Yoshua Bengio and Christopher D.
Manning,Deep Learning for NLP (without
Magic),分别讲了NN,Neural Word
Representation,和在language
model和POStagging的应用。特别强调了unsupervised
pre-training的重要性。非常符合自己兴趣的报告。
2012圆满闭幕,下面是几位重量级报告人的PPT链接分享。 供参考
: 本周六正式开讲了!前Yahoo!北京研究院广告与推荐技术负责人、高级科学家刘鹏
将系统性的讲解在线广告涉及到的技术、算法、框架等。课程预计18个学时,报名方式见
仅剩10个名额,欢迎对在线广告技术感兴趣或正从事相关研发工作的朋友报名。
: 加州理工学院Yaser
S. Abu-Mostafa教授的机器学习课程Learning From Data推出了topic-by-topic版本
l @张栋_机器学习: 想学习机器学习的同学,可以关注: Stanford
machine learning video lectures
周的课程,全面讲解了机器学习的基本概念,算法和应用
文章推荐:
最近微软研究院的一篇新论文介绍了如何用众包的方法收集自然语言语料库:通过向人群注入语义结构(意图),来分析收集到自然语言的语义正确性,自然程度,以及偏离程度。
推荐国外一篇文章:《解析大数据》(Deconstruction big
data) 从概念、起源、价值、技术内容及就业前景等几维度阐述big
data。值得一读~
三大核心技术文献 : 弯曲评论
同学每天替我淘宝:-)。]
l “The Big Lie About Big Data” 这篇文章很有趣
讲了 Big Data 是不是 Big Lie?我觉得关注数据大小不是重点,重点是 Big Data 可以带来哪些大应用 (Big
Applications),能解决哪些大问题 (Big Problems)?这些应用和问题是小数据无法解决的。
Science杂志最新论文“Identifying Influential and
Susceptible Members of Social
Networks”,关于社会网络中用户影响力和受影响属性的。先发再看。 <img ALT=":)" src="/blog7style/images/common/sg_trans.gif" real_src ="/wp-includes/images/smilies/icon_smile.gif"
TITLE="机器学习研究和应用&近期热点集锦" />
发表了博文 《机器学习新动向:从人机交互中学习》 -
在《机器学习正在改变我们的工作与生活》一文中,分析了为什么机器学习会成为计算机系统智能化的最有力手段。在《统计学习方法》一书中,介绍了机器学习的最
请关注我的新论文,社交网络是如何影响我们的金融市场的:交易员们因为受到其他交易员的影响,常常会做出非理性的决定,最后汇总起来成为了股市过度涨跌的原因,以及如何利用这些社会化知识来在股市赚钱
一篇好文章,题目“Google's Hybrid Approach to Research".
有一点建议特别想分享给有志于工业界发展的博士生们 - write production
or near-production code from day one, do NOT use Matlab.
Unreasonable Effectiveness of Data
改变了我对大数据的看法,特别是在计算语言学的问题上。
: 要领略高斯分布的美妙,至少有几个方面不可缺少:1,
与中心极限定理的联系;2,与最小二乘拟合的关系;3,与最大熵原理的联系,高斯分布在给定一阶和二阶统计量约束下熵最大的分布;4,高斯分布与机器学习
2范数正则化的联系,特别是SVM中常用最大间隔的概念的联系。
其它请补充。
Science:发表哈佛大学研究人员的题为“Detecting novel
associations in large data sets
Science”的文章,介绍了一种强大的在庞大数据集中发现潜在重要关系的统计方法。
在哈工大深圳研究院召开的第九届全国自然语言处理青年学者研讨会的ppt已经上载到中国中文信息学会网站了,详见
,再次感谢
等老师和志愿者同学,大家辛苦了!
推荐一个讲众包的PPT,,讲者是清华大学的李国良老师
好书推荐:
《Social Network Data
Analytics》介绍了社会化网络数据分析的基本知识,涉及统计特点,分类方法,链路预测,可视化,数据及文本挖掘等方面的算法。适合入门级别的人员阅读。通过
分享文件"Social Network Data Analytics.pdf"
顺便推荐另外一本陈希儒的概率课本《数理统计学教程》,陈老师是院士,写的概率课本是我见过国内最好的,不是照本宣科,而是会在课本中分析讨论很多的概率统计思想,读起来很受启发,不枯燥,作为入门教材是很棒的。
凌晓峰(Charles
Ling)教授和杨强教授出版的关于如何做研究的书(pdf)免费下载,欢迎互相关注。Crafting
Your Research Future: A Guideto Successful Master's and Ph.D.
Degrees in Science & Engineering
点链接下载:
老师的译著《大数据》,9月末上市后,目前已在当当网位列第3,京东网位列第2,真是一场大数据时代的及时雨。本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。
工具推介:
总结了下的 更新记录:
1.所有模型基于自主标注语料,不受第三方语料伴随的协议限制;
2.增加指代消解功能; 3.词性标注支持自定义词典;
4.改进依存句法分析算法,提高准确率;
5.依存句法分析支持输出依赖关系类型;
6.改进分词、词性标注特征,提高准确率;
7.重新梳理了程序结构。
: 正式发布中英依存分析器DuDuPlus,下载地址
。主要特点:正确率在CTB4达到88%/在CTB5达到83%(分词正确的条件下)/在PTB达到93.4%。欢迎使用测试。
最近社交网络分析以及图挖掘比较热门,给大家推荐一款不错的学习素材:SNAP - Stanford
Network Analysis Platform。有代码:;有教程:,有数据:。不学白不学!
微博情感分析评测原始数据和标注评测数据公布:
分享了一个很不错的文件:"微博情感分析评测数据.zip",快来看看吧~
: 【NiuTrans开源统计机器翻译系统】NiuTrans是东北大学自然语言处理实验室花费四年时间独立研发的一套开源统计机器翻译系统。数据大小:43.78M;数据来源:东北大学自然语言处理实验室;数据详情:
本中文情感语料库采用网络博客文章作为初始文本语料,人工标示出了这些中文文本中的与情感相关的语言信息。构建该语料库的目的在于支持中文领域的文本情感分析系统的开发及评测。
python中文分词 | isnowfy
46行的中文分词
推荐一篇共指消解的简单介绍和常见方法文章: -
原文地址:
【Learn SVM Step by
Step系列原创视频之一】Libsvm的下载、安装和使用,作者:
高清视频与PPT下载地址:
将陆续给您奉送精彩SVM视频,敬请关注!
机器学习开源工具集-MLOSS(Machine leaning open source software)
- 我爱公开课
(分享自 )
招聘信息:
新加坡科大张岳老师招收research
assistant或者intern (visiting PhD
student),他的研究方向是parsing, Chinese processing,
translation,张老师人很nice,感兴趣的请和他联系。
: 昆士兰大学,Data
Engineering and Pattern Recognition Division 现在
open 2个博士后职位(72000AUD+ per year)
和数个博士研究生职位(~25000AUD per
year),在数据库,多媒体,数据挖掘,模式识别和机器学习领域。请帮忙发布一下。有兴趣的,请与我们联系。
我这边需要一位靠谱的算法工程师,最好有一些机器学习背景。实习生也可以,各位老师,同学,烦请帮我转发一下,谢谢!真实的问题,有趣的挑战,想发top
paper的PhD同学也请多多考虑哦。
又增加一位招工的老板
同志,他是盘古搜索负责云计算的老板,需求是
请同学们,朋友们考虑
今天向大家介绍天羽
,阿里集团DBA基础运维组负责人,精通Oracle,MySQL管理,PHP和Perl的开发,见证了淘宝去IOE的进程,对采用新硬件技术提升数据库性能有丰富的经验,同时负责数据库自动化运维平台DBFree的开发,最近正在饥渴地寻找各路人才加盟。
高频交易团队招聘(上海陆家嘴)要求:数学、统计学、物理等理工科专业,扎实的数学和统计学理论基础和应用能力,掌握一门数据处理和一门编程
软件。数据挖掘,机器学习,信号处理等某个领域较为精通。热爱交易。具有数据处理经验、相关工作经验、博士学位者优先。简历投递地址
又迎来一位提交信息的老板
同志,他是清华NLP组毕业的博士,牛人,人品巨佳,在机器翻译界有很高造诣,现在需求的是有创业心态的NLP研发工程师。
其他招工信息参见:
l 迎来了第三位主动提交信息的老板,
同志,他是“广东天拓 topsem负责人,topsem要做最好的SEM工具系统” ,需求的是“Mysql
DBA,肯吃苦、执行力良好(15-25K/月)” 。还是比较有诚意的,请关注
右侧的老板区还有其他更多靠谱老板,靠谱招工信息。
名师介绍:
斯坦福大学Jure Leskovec,出生于斯洛文尼亚,social
network mining领域高富帅,师承Christos
Faloutsos(data
mining领域又一牛人),研究领域的harry
potter(长得帅且长得像harry ),个人主页
忍不住吐槽:很多學生,真是不知道其他一流學校的學生,教授,甚至功成名就的學者是怎樣忘我工作的。我導師Jiawei
Han教授60多了,文章500多篇,每天還在15小時不懈工作,即使食物中毒了也不說,一邊偷偷嘔吐一邊和我們繼續討論問題
,每次deadline還和學生一起奮鬥到凌晨。Now,你還好意思說累?!
l Judea Pearl 教授的图灵讲演。The Mechanization of Causal Inference: A
“mini” Turing Test and Beyond。
推荐机器学习/数据挖掘之中国大牛 -
原文地址:
工程架构:
: 这篇博客收集了很多著名网站架构相关的PPT和文章,很多的干货,包括Amazon,Facebook,Google,LinkedIn,Yahoo,Twitter,豆瓣,优酷,淘宝,等等。。有的可能是你首次见到,赶快收藏。
推荐老王同学写的这一篇《Nginx 与
Lua》,算是 ngx_lua
的入门快速教程了,呵呵:
而这一篇《实现一个简单的服务端推方案》介绍了一种基于 ngx_lua 实现
comet 推送服务器的方案:
也写得非常好。无论如何我得赶紧着手实现 lua_ignore_client_abort off
Distributed Algorithms in NoSQL Databases
这篇雄文从Data
Consistency,Data
Placement,System
Coordination讨论了各种实现策略,非常值得一读
LOFTER博文一篇《Spanner: Google’s
Globally-Distributed
Database》。Spanner提供了高效低延迟的多操作组合事务、一致性读和快照读,可以跨物理区域和多个数据中心。很牛,全面胜过之前的
Megastore。如果之前没读过Megastore论文的,不用读了,看Spanner就行。
【大型网站架构演变和知识体系】有人把这张图后的文章挖出来了,阐述一个普通的网站发展成大型网站过程中的一种典型的架构演变历程和知识体系。推荐阅读 //:大型网站架构演变和知识体系的文章
入门后还是推荐HighScalability
"Data+Structures+and+Algorithms+for+Big+Databases.pdf"。/s/d-4Zk
其它信息:
有人问我能不能做
“无人驾驶汽车”?能也不能。“无人驾驶技术”
是比 “搜索” 难很多的技术:搜索
100 次 1 次不成功,用户可以忍;无人驾驶
次成功,1次出了事故,用户是不能忍受的!也可以做,为什么?复杂路面转为手工驾驶就可以了。
"机器 + 人"
一起解决问题 。
Edwin Chen 一样,Salman Khan
放弃对冲基金,从事互联网教育,建立 Khan Academy www.khanacademy.org ,
with 2000+ video from basic addition to advanced calculus, physics,
chemistry, biology ... Salman Khan 富有激情的演讲 Let's
use video to reinvent education
Khosla谈招聘人才。有点非常赞同,不需要太专注于学历。我也听说一些优秀的人才抱怨说自己能力很强但是不是名校毕业,进不了Google。这些人可
以考虑品友互动,这里不会因为你不是名校或者不是硕士毕业,就进不来,也不会为此影响你的职业发展,完全看能力说话。
人脸识别果真是门大生意?传Google以约3000万美元收购面部识别公司Viewdle
【为什么美国互联网公司兵败中国?】1)太短视:用全球指标要求中国分部,无视中国巨大市场,2)不授权给本土团队:在本土短兵相接时,却要
等全球总部批准各个细节,3)全球平台妨碍本土化,4)文化差异:只愿意重用美国名校毕业,英文流利的海归。我的英文短文见下,或者点击:
问题:怎么从weibo中用机器学习的方法判断用户是不是抑郁症患者?怎么预测用户的自杀倾向?如果是犯罪倾向呢?向Person
of Interest里面一样。应该是个很有意义的课题。 附走饭的诗:
二十一世纪最性感的职业:数据科学家 |
性感事物方面的权威《哈佛商业评论》宣布,“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。
不管老板懂不懂数据科学家是干什么的,反正最近几...
: 是解决完美覆盖问题的最优美算法,难怪Donald
Knuth为其取名为Dancing
Links。大致思想是把问题转化为一个01矩阵,选取一些列,使每列都包含且只含一个1。采取的数据结构是双向十字链表结构。这个PPT
浅显易懂。更深入请看
Rush》是David
Winton导演于1998年至2000年间拍摄的纪录片,纪录了Netscape工程师们将浏览器源代码放出,成为Mozilla项目的经过;同时
Netscape也正经历被AOL并购的过程。本片描绘了Netscape的工程师们,牺牲日常生活与家庭,努力防止公司倒闭的经历。cc
下图简单总结了实时竞价广告系统的 6 个概念,详细的介绍可以参看
“Real-time Bidding (RTB) & How Is It Changing Online
Advertising in the Japanese Market”
【工作面试的3个本质问题】所有的面试问题本质上可以归结为3个:1. 此人能不能做这份工作?(考察工作技能、能力和相关经验等)
2. 此人是否喜欢/真正想做这份工作? (考察求职动机和价值观等)3.
此人能否和现有团队一起把这份工作做好(考察工作态度、文化匹配度和团队精神等)。[供面试官朋友参考]
同学们,下一次西瓜大会的赞助已经到位了(感谢百度云的
的大力支持)。这次我们要搞得有诚意一点。招募3名志愿者,酬劳是100元每人,主要工作是制作海报和张贴,希望有这方面的经验的清华同学和我联系。
这次我们预计参会人数是300人。
时间是10月24日民间程序员节的夜里10点到凌晨1点。
史上最完整,最高清的简历撰写技能培训!当然你最好能够听得懂英文!到<上去搜索教程! 另外什么C#,
JAVA, HTML5编程教程都有!
纪录片《史蒂夫·乔布斯:生命的奥秘》的精彩片段,乔布斯用实例说明真正做成一些事的人和只会“做梦”的人的区别,视频(2分钟,双语字幕): 。
l @:上交ACM出身的学生搞机器学习也都不赖
更是其中的翘楚
商业讯息:
【微软宣布战略性投资社交网络影响力评分系统Klout】上周,微软宣布对Klout战略性投资,并展开双方面的技术合作,以期将社交网络影
响力评分系统Klout的内容集成到Bing的搜索结果中。这次和Klout合作,Bing在社交内容搜索领域又一次走在了谷歌的前面。
【独家快讯:LinkedIn变身媒体平台,直接向Twitter宣战】LinkedIn刚发布了类似博客平台的功能,可以让
LinkedIn用户直接在上面发表文章,并设置了用户间“关注”与“被关注”的功能,而这正是对Twitter此前API限制用户分享内容至
LinkedIn上的“报复性”回击。两家终于撕破脸皮。
聘信息搜索引擎Indeed
值10亿美元吗?】最近日本招聘公司Recruit
收购美国垂直搜索网站
Indeed,估值号称近10亿美元。Indeed员工有550人,去年收入约5000万美元,假定利润2500万,PE近40倍,偏高,我觉得30倍较
合适,估值7.5亿。求职的朋友可以看看。[Tom
推荐指数 &#9733;&#9733;&#9733;&#9733;&#9734;]
【消息速递】重磅消息,新华网:“手机号=QQ号,电信与腾讯下月推出同号业务”。手机号=QQ号,不出意外的话,这个业务下月将正式面世
了。昨天,中国电信人士透露,该公司与腾讯合作的这一业务将于10月正式开放运行。消息人士说,首先从180号段开始,并逐步推广到电信所有号段。
前几天,全世界最大招聘信息搜索引擎Indeed宣布了其被收购的消息。收购方为日本最大人力资源和消费互联网公司Recruit,业界分析
人士认为,此次交易价格极有可能接近10亿美元。Indeed一直很低调,它商业模式和
类似,产品覆盖全球六大洲53个国家,每月超过8000万用户
写在最后:
本列表的信息是从众多weibo用户中获取的,感谢大家!特别感谢余凯, 李航, 张栋,
梁斌,陈利人以及老师木,本列表的70%以上信息是直接或间接从你们weibo获知,谢谢!希望这份信息有助于大家更好的学习交流,如果您有反馈和建议请@
或Email至。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

 

随机推荐