SAS中文论坛

标题: 数据前沿——值得在Twitter上关注的十位大数据专家(上篇) [打印本页]

作者: Emma    时间: 2015-7-19 11:12
标题: 数据前沿——值得在Twitter上关注的十位大数据专家(上篇)
值得在Twitter上关注的十位大数据专家



        前言:在学习机器语言的路上,从社交网站也能获得很多实用和新鲜的信息,互联网时代,有一种技能显得越来越重要:搜索能力。小编推荐的这篇文章,希望给读者在数据学习路上带来帮助。

【IT168 专稿】



       乍看起来,在Twitter上寻找关于大数据的智慧似乎是种充满讽刺意味的建议。事实上,大多数普通消费者与企业用户都将Twitter作为一套数据生成的平台,由此提供的信息将作为分析的素材而绝非能够指导分析方案的参考。


  然而Twitter确实承载着大量极具价值的大数据专业知识——前提是我们知道要在哪里找到它们。与其它社交平台一样,Twitter有时候同样嘈杂而毫无实际价值。如果再加上“大数据”这个时髦词汇,这里的混乱与繁杂又将上升到新的高度。因此,我们到底该如何寻获可资借鉴的有价值信息?

  如果大家不太过纠结于“大数据”这一专业词汇,那么找到的信息往往更具参考意义。“通常情况下,那些最热心的大数据讨论者们往往根本不是什么‘大数据专家’,”MongoDB公司营销、业务发展以及集团战略副总裁Matt Asay表示。

  Asay与其他一些对大数据领域有着深刻见解的专家为我们带来了Twitter上那些最值得关注的发布对象,这些发布者带来的新闻、主张以及网络等等足以充实学习者的大脑。当然,我们也从中进行了第二轮甄选,最终提出十位在Twitter上最值得关注的大数据专家。当然这只是一个起点——大家完全可以为自己列出一条更长的关注名单(稍后我们会进一步阐述)。说到他们位列推荐榜的共同特征,这些专家都成功地在140个字母的严苛限制下完成了大数据知识传播这一高难度任务。

  这无疑是件好事。任何人都可以轻松在自己的推文或者其它通信方式中加入“大数据”或者其它相关技术术语,但这并不意味着这些家伙真当得起“专家”的名头——这正如我可以在推文中讨论美味糕点的制作方法,但这并不代表我本人是位技艺出众的大厨。因此即使是在相关术语之外谈论其它技术领域——例如开源——虽然从表面上看大数据的契合程度并不紧密,但同样有可能与之保持高度相关性。请大家在选择关注对象时牢牢记住这一前提,否则很可能被花里胡哨的内容搅乱了心神。

  Asay还指出,有时候直奔特定信息类型的来源也是很有效的学习方式。“我通常倾向于Pew Research这类能够直接获取重要信息的关注对象,而不愿通过他人引述的方式了解情况。”

  我们之前曾经在《Twitter上值得关注的IT领导者》一文中探讨过此类选择标准,这些规则在大数据领域自然也同样适用、只不过需要在细节上作出调整。我们并不会以特定的工作职级或者岗位作为评判标准,只要工作内容上有所关联即可过关。(在这里我们只考虑发布信息的个人,组织或者企业并不在考量范围之内。)

  我们还除非了那些与大数据方案的销售、市场推广以及其它类似事务有关的发布者。Asay本人就是个很好的例子——虽然他发布的内容同样值得关注,但由于在“营销、业务拓展以及企业战略”方面身负要职,因此我们不会将他纳入名单。我们对关注对象的现有关注者数量方面没有提出硬性要求,毕竟更重要的是所发布信息的质量与一致性、而非人气高低(不过本次上榜者当中确实有一些已然拥有大量关注者)。

  让我们再次回到榜单本身:本次选择错过了哪些理想关注对象?我们认为这份名单本身非常优秀,但它仅仅算是个开端而并非最终成果。根据个人取向的不同,大家也可以拥有与众不同的个人选择。为什么一定要固守在圈子、学习与现有网络的束缚之下?社交平台的本质在于共享,因此不要被太多不必要因素阻碍了手脚。大家不妨在评论中写下自己喜爱的大数据技术大师,从而让他们的真知灼见能为更多人带来启发。

  Gartner公司IT分析师,Merv Adrian (@merv)


  MongoDB公司的Asay力荐Adrian,此外Gartner同僚Svetlana Sicular与RedMonk公司的Stephen O’Grady(同样位列此份榜单)也得到了他的肯定。Asay表示,这几位都是帮助他了解大数据情报的好伙伴。原因之一:三个人从来不会搞炒作、推噱头。“每一位都能帮助大家更清晰地勾勒出大数据宏观框架,同时又不至于被层出不穷的热门消息搞得应接不暇,”Asay指出。Adrian的推文通常以Hadoop、NoSQL以及微软等为主要话题。

  RedMonk公司分析师Stephen O’Grady (@sogrady)


    O'Grady是Asay推荐的大数据三巨头中的另一位,喜欢直接通过搜索热门词语——也就是“大数据”——进行查找的朋友很容易与他失之交臂。他的推文与博文涉及各类软件与开发话题,而且并不局限于此。这里要提醒洋基队的球迷:O’Grady是位新英格兰人,所以有时候会发布一些关于红袜队的消息——而且往往与IT技术相关。

  Gartner公司研究主管Svetlana Sicular (@Sve_Sic)


  作为Asay推荐的大数据三巨头第三名,Sicular的推文围绕着大数据、分析、商务智能、数据仓库、数据架构以及Hadoop等相关话题展开。她还会在推文中提到大数据领域的特定供应商,例如Cloudera,并分享她本人在Gartner研究工作中了解到的报告信息,例如:到2015年,便于25%的大型企业将配备“首席数据官”职位。


        乔治梅森大学数据科学家、天体物理学与计算机科学教授Kirk Borne (@KirkDBorne)


  大家千万别被“火箭科学家”这类称谓吓破了胆,Borne经常会在自己的Twitter上发表一些建议,同时定期为我们带来与大数据及相关话题相关的新闻与链接。在MongoDB公司的Asay看来,Borne的推文相当于一份业界消息必读清单——这一论断也得到了技术人员们的广泛认可。Borne“会定期发布及转发与大数据及数据科学紧密相关的文章链接,”Revolution分析公司执行长David Smith表示。“我喜欢看他以科学视角品评这类传统的、面向业务的文章。”


  KDNuggets.com网站编辑Gregory Piatetsky (@kdnuggets)


  Piatetsky所供职的KDNuggets网站(其中KD是指‘Knowledge Discovery’,即知识探索)堪称一座满载大数据、数据挖掘以及分析信息的宝库。他的推文除了关注以上重点内容之外,也经常涉及网络上流传广播的各类大数据指导性消息。各位求职者们请格外注意:KDNuggets网站还地定期发布与数据技术工作岗位相关的最新情报。



      本文转自IT168 网站 作者:核子可乐





欢迎光临 SAS中文论坛 (https://mysas.net/forum/) Powered by Discuz! X3.2