数据科学一带一路面临的挑战共同挑战有哪些

【观点】新营销人的挑战:如何做一个会讲故事的数据科学家
SocialBeta
【观点】新营销人的挑战:如何做一个会讲故事的数据科学家
SocialBeta |  14:31
作者:Laura Patterson/编译:马金多
SocialBeta编者按:本文作者劳拉o派特森是VisionEdge Marketing的创始人和总裁,20多年来一直致力于帮助诸如Cisco、Elsevier、ING、Intel、Kennametal 和 Southwest Airlines等公司高管证明和提高组织营销的价值。本文作者将讲故事艺术列为大数据营销背景下数据科学家的重要特质,给我们耳目一新的感觉。作者在此给了我们一个引子,而在营销数据指数式增长的背景下,如何有效的转化和利用大数据确实是新营销人不得不思考的问题。
推荐阅读:
你或许已经在英国湖畔派诗人塞缪尔o泰勒o柯勒律治的音乐叙事诗《古舟子咏》中听过这一节:“水呵水,到处都是水, 船上的甲板却在干涸; 水呵水,到处都是水, 却没有一滴能解我焦渴。”
你是不是在想此摘引跟市场营销有什么关系?这就像世界上海洋中的水容量很巨大一样,营销人员可利用的数据容量也是非常之多。
更多新营销渠道,竞争和市场细分,还有更短的产品生命周期,更大的价格透明度,更高的消费者体验预期,这些因素共同造成了营销数据量的指数式的增长。
但除非能够有效收集所有这些数据,分析他们,并将之转换成有意义和可操作的见解——然后利用它们讲述一个引人入胜、切实可行的故事,这样这些数据才有价值——否则它就像盐水对于一个漂浮在海上的口干舌燥之人一样毫无用处。
一、数据分析能力对市场营销至关重要
最近一份来自经济学人智库的研究显示,商业领袖们正考虑为市场营销和预测分析建立一个数据战略,并将此作为企业市场营销最最重要的战略之一。该调查的参与者表示营销人员通常缺乏数据科学和商业分析技能,即从大大小小的数据集中提取有实际价值讯息的技能——这就是许多组织缺乏的一种信息,技术和数据科学战略。
这种能力缺口已为从其他学科中加入营销人行列的数据科学家们创造巨大的机会,对数据科学家的需求正急剧上升(哈佛商业评论称之为“21世纪最性感的职业”)。
对于那些员工队伍中还没有数据科学家这一类角色的营销主管,以下是关于这一角色的一个简短的职业技能描述)。数据科学家通过捕捉、操控和转换数据来创造价值。他们要具备精湛的技术才能,例如设计算法解决复杂商业问题的才能。理想情况下,数据科学家利用内部的和外部的、结构化的以及非结构化的数据,帮助一个组织做出更好决策并获得竞争优势。
二、以讲故事作为数据技能
数据科学家面临的终极挑战是运用数据来创造故事。称职的数据科学家能够运用电子表格以及可视化工具来支持他们的分析。他们真正的价值在于他们的某种能力,即将数据转换为能实现组织内外部沟通交流的叙述性事件的能力。
互动视觉化设计艺术家乔纳森o哈里斯,“我们感觉良好”①和“捕鲸”的创作者,提醒我们“数据仅仅是故事的一部分”。他补充说:“我认为人们已经开始忘记人类故事的巨大力量,人们用他们对情感的共鸣来交换对数据,网络,模式和全面信息的盲目迷恋oooooo人类的本真特性才是最主要的东西,数据应该用以丰富它。”
三、关于数据叙事的5点建议
许多和我们工作的营销主管向我们寻求过意见,有关如何帮助他们的数据科学家超越数据而成为一个会讲故事的人。以下是达到该目标的5点指导性建议:
1、以需要回答的商业问题为起点(把它看成一个亟待解决的谜团)。例如什么样的顾客最有可能购买某种特定商品或服务,或者是下一个最值得追求的细分市场是什么,亦或是什么是影响客户售后服务体验的关键客户接触点(客户在与组织发生联系过程中的一切沟通与互动点,包括人与人的互动点、人与物理环境的互动点等)?知道这些答案将会帮助你制造和你的受众相关的故事。
2、对你的数据进行正确提问,以便收集解决这个谜团所需的“证据”。尝试在没有商业问题的情况下从大量的数据中搜集讯息,这可能会让你记下大量的“兔子洞”,获得许多意料之外的收获。
3、精心编织这个故事。搭好舞台,定好角色。例如有哪些顾客,有哪些竞争者,让这个故事清晰难忘。一个好故事得要有一个情节——你扮演的是一个向成熟市场发起挑战的人,还是一个行业的领军人物,正面临着利基者②的步步侵袭?故事能够引发行动或产生非常强烈的印象是至关重要的,要传达出人物形象的意图与想法。
4、决定要囊括什么数据。通过组织数据来补充完整故事叙述,支撑人物形象,揭示故事情节。绝大多数人无法从表格中识别突出要点。他们需要图片。将数据视觉化以吸引受众,视觉化是一个讲故事的过程,即通过绘画来描述统计信息的这样一个讲故事的过程。谷歌上的分析学倡导者丹尼尔o维斯伯格说:“出色的视觉化数据是自成一体的。”
5、改编故事以迎合受众。语言,语气和关注点都需要根据听故事的人来调整。企业高管会更喜欢一个故事的精简版——只需要(产品或服务)亮点以及行动建议。负责制定行动计划的人或许想要一个故事的详尽版,包括对所有参与者以及其他事物之间相互关系的理解。
更多地是,营销人员需要能够以多种多样的方式来运用数据——比如能够告知组织消费者的购买偏好,或者能将人物与营销渠道和接触点匹配。
那些能够将精湛的讲故事艺术引入来应对这些挑战的数据科学家不仅能够帮助你证明并提升组织中市场营销的价值,最终还能获得市场知名度。
①We Feel Fine:美国布鲁克林艺术家乔纳森o哈里斯(Jonathan Harris)和塞普o卡姆瓦尔(Sep Kamvar)的作品“我们感觉良好”(we feel fine)是研究社会心理学和个人感受的项目。每隔几分种,“我们感觉良好”的网络程序会自动收集主要网络博客服务器上的数据,例如带有"I feel"或者"I'm feeling"句子的新文章,把它们放到网站上面。
②Niche:利基市场(英语:niche market)是指由已有市场绝对优势的企业所忽略的某些细分市场并且在此市场尚未有完善的供应服务。一般由较小的产品市场并具有持续发展的潜力中一些需要且尚未被满足的族群消费者所组成为了满足特定的市场需求,价格区间,产品质量,针对细分后的产品进入这个小型市场且有盈利的基础(来源于维基百科)。
原文链接:
本文由SocialBeta贡献者编译,如需转载请注明SocialBeta和编译者(以上信息需全部保留)。
你可能喜欢 | You Might Also Like
clovey |  14:00
clovey |  17:01
MC |  18:01
SocialBeta |  14:57
SocialBeta |  10:32
共有 0 条评论
暂时木有评论没账号?一键数据猿账号
已有账号?
已有账号?
大数据快播
不容错过的资讯
大数据学堂
大数据企业推荐
大家都在搜查看: 20|回复: 0
数据科学面临的共同挑战有哪些?
发表于 昨天&17:51
  随着我们进入2017年下半年,是时候看看那些使用数据科学和机器学习的公司面临的共同挑战。假设你的公司已经在大规模收集数据,需要用到分析工具,而且你已经认识到数据科学可以发挥重大作用(包括改善决策或企业经营、增加收入等等),并进行了优先排序。收集数据和识别感兴趣的问题并非小事,但假设你已经在这些方面起了个好头,那么还剩下哪些挑战呢?  数据科学是一个宽泛的话题,所以我要说明一下:本文主要探讨的是督导式机器学习的使用现状。  一切从(训练)数据开始  假设你有一支处理数据摄取和整合的团队,以及一支维护数据平台(“真相来源”)的团队,新的数据来源不断出现,由领域专家负责找出这些数据来源。而且,由于我们主要探讨督导式学习,因此,训练数据的缺乏依然是机器学习项目的首要瓶颈,这一点毫不意外。  在迅速创建庞大的训练数据集(或者加强现有的训练数据集)方面,有一些很好的研究项目和工具。斯坦福大学的研究人员已经证明,弱监督和数据编程可以用来训练模型,不必使用大量手工标记的训练数据。深度学习研究人员对生成式模型的初步研究,已经在无督导式学习的计算机视觉和其他领域取得了可喜的成果。  “思考特性而不是算法”,这是在机器学习背景下评估数据的另一个有用方法。友情提示:数据扩充可能改善你的现有模型,在某些情况下,甚至有助于缓解冷启动问题。大部分数据科学家可能已经利用开源数据或者通过第三方数据提供商,来扩充他们的现有数据集,但我发现,数据扩充有时会遭到忽视。人们觉得,获取外部数据、使之规范化、并利用这些数据进行实验,这不像开发模型和算法那么具有吸引力。  从原型到产品  让数据科学项目实现产品化,这是许多用例的目标。为了使这一过程更有效率,近来出现了一个新的工作角色——机器学习工程师。还有一套新的工具用于推进从原型到产品的转变,帮助追踪与分析产品有关的背景和元数据。  机器学习在产品中的应用还处于早期阶段,最佳实践才刚刚开始出现。随着高级分析模型的普及,有几点需要考虑,包括:  · 部署环境:你可能需要与已有的日志或A/B测试基础设施进行整合。除了把稳定、高性能的模型部署到服务器以外,部署环境还越来越多地包括,如何以及何时把模型部署到边缘侧(移动设备是常见的例子)。把模型部署到边缘设备的新工具和策略已经出现。  · 规模,延迟,新鲜度:需要用多少数据来训练模型 模型推导的响应时间应该是多少 重新训练模型和更新数据集的频率应该是多少 后者说明你拥有可重复的数据管道。  · 偏差:如果你的训练数据不具有代表性,那么你将得到不理想(甚至不公正)的结果。在某些情况下,你也许可以利用倾向得分或其他方法,相应地调整数据集。  · 监控模型:我认为人们低估了监控模型的重要性。在这个方面,学过统计学的人拥有竞争优势。想知道模型何时退化以及退化了多少,这可能很棘手。概念漂移也许是一个因素。就分类器而言,一个策略是把模型预测的类别分布与预测类别的观测分布进行比较。你也可以设立不同于机器学习模型评估指标的商业目标。比如,一个推荐系统的任务可能是帮助发现“隐藏或长尾”内容。  · 关键应用程序:与普通的消费者应用程序相比,在关键环境中部署的模型必须更加稳定。另外,这类环境中的机器学习应用程序必须能够数月“连续”运行(不会发生内存泄漏等故障)。  · 隐私和安全:通常来说,如果你能让用户和企业相信他们的数据是安全的,那么他们可能更愿意共享数据。如上文所述,用额外特征进行扩充的数据往往会带来更好的结果。对于在欧盟经商的企业而言,一个迫在眉睫的问题是,《一般数据保护条例》(GDPR)将于2018年5月生效。在其他领域,对抗性机器学习和安全性机器学习(包括能够处理加密数据)的实践研究开始出现。  模型开发  媒体对模型和算法开发的报道越来越多,但如果你同数据科学家交谈,他们中的大多数人都会告诉你,训练数据的匮乏以及数据科学的产品化是更加紧迫的问题。通常来说,市面上已有足够多的简单明了的用例,让你可以开发你喜欢的(基本或高级的)算法,并在以后进行调整或替换。  由于工具使算法的应用变得容易,因此,先回想一下如何评估机器学习模型的结果,这很有必要。尽管如此,不要忽视了你的业务指标和目标,因为它们未必与调试得最好或表现得最好的模型完全相符。关注与公正和透明有关的事情进展,研究人员和企业正开始检查、解决这方面的问题。对隐私的担忧,加之设备的激增,催生了不依赖于集中式数据集的技术。  深度学习正逐渐变成数据科学家必须了解的算法。深度学习最初用于计算机视觉和语音识别,现在开始涉及数据科学家能想到的各种数据类型和问题。其中的挑战包括,选择适当的网络结构(结构工程是新的特征工程),超参数调整,以及描述问题和转换数据以适合深度学习。(巧合的是,今年我见过的最有趣的大型数据产品之一,并不是基于深度学习。)  很多时候,用户更喜欢可解释的模型(某些情况下,黑盒模型不被人们所接受)。考虑到基本机制易于理解,可解释的模型也更容易改进。随着深度学习的兴起,企业开始使用那些能解释模型预测原理的工具,以及能解释模型从何而来(通过追踪学习算法和训练数据)的工具。
站长推荐 /1
日,将是中国企业级大数据可视化应用领域的一个里程碑!中国领先的大数据&商业智能厂商奥威软件潜心研发18个月,采用最新的前后端技术,终于推出了全新的跨平台大数据可视化分析平台——OurwayBI!
Powered by403 Forbidden
Request forbidden by administrative rules.

我要回帖

更多关于 人类面临的挑战 的文章

 

随机推荐