宝马游戏官方网站

宝马游戏官方网站品牌产品
Hadoop十岁!DougCutting成长史+他眼中大数据技术的未来
发布时间:2023-04-24
  |  
阅读量:
本文摘要:1985年毕业于美国斯坦福大学的DougCutting并不是一开始就决意投身IT行业的。但又如何沦为了Hadoop之父?以及这10年中,Hadoop的发展和未来期望又是如何的? 上次看到(祭拜)Hadoop之父DougCutting是在2年前,2014中国大数据技术大会上。今年Hadoop10岁,刚刚看见他的Hadoop十周年贺词,感觉时间飞逝。最近CSDN和InfoQ都在制作Hadoop选题。 云栖社区也寻找不少阿里Hadoop生态高手,2-3月不会做到多场动态在线培训。

宝马游戏官方网站

1985年毕业于美国斯坦福大学的DougCutting并不是一开始就决意投身IT行业的。但又如何沦为了Hadoop之父?以及这10年中,Hadoop的发展和未来期望又是如何的?  上次看到(祭拜)Hadoop之父DougCutting是在2年前,2014中国大数据技术大会上。今年Hadoop10岁,刚刚看见他的Hadoop十周年贺词,感觉时间飞逝。最近CSDN和InfoQ都在制作Hadoop选题。

云栖社区也寻找不少阿里Hadoop生态高手,2-3月不会做到多场动态在线培训。大家想要听得什么,告诉他我们。  2013年时,CSDN曾有文章详尽讲解了Hadoop之父DougCutting。

直到现在,再度读者还是深有体会。要告诉,1985年毕业于美国斯坦福大学的Cutting并不是一开始就决意投身IT行业的。在大学时代的头两年,Cutting自学了诸如物理、地理等常规课程。

因为学费的压力,Cutting开始意识到,自己必需自学一些更为简单、有意思的技能。这样,一方面可以协助自己偿还贷款,另一方面,也是为自己未来的生活做到想。

因为斯坦福大学座落在IT行业的圣地硅谷,所以自学软件对年轻人来说是再行大自然不过的事情了。  Cutting的第一份工作是在Xerox做到实习生,Xerox当时的激光扫描仪上运营着三个有所不同的操作系统,其中的一个操作系统还没屏幕维护程序。因此,Cutting就开始为这套系统研发屏幕维护程序。由于这套程序是基于系统底层研发的,所以其他同事可以给这个程序加到有所不同的主题。

宝马游戏官方网站

这份工作给了Cutting一定的满足感,也是他最先的平台级的作品。  可以说道,Xerox对Cutting后来研究搜寻技术起着了决定性的影响,除了一段时间的在苏格兰工作的经历外,Cutting事业的跟上阶段大部分都是在Xerox童年的,这段时间让他在搜寻技术的科学知识下有了相当大提升。他花上了四年的时间做研发,这四年中,他读者了大量的论文,同时,自己也公开发表了很多论文,用Cutting自己的话说道我的研究生是在Xerox读书的。

  尽管Xerox让Cutting累积了不少技术科学知识,但他却指出,自己当时做的这些研究只是纸上谈兵,没有人试验过这些理论的可实践性。于是,他要求勇气地迈进这一步,让搜寻技术可以为更加多人所用。

1997年底,Cutting开始以每周两天的时间投放,在家里试着用Java把这个点子变为现实,旋即之后,Lucene问世了。作为第一个获取全文文本搜寻的开源函数库,Lucene的最出色自不用多言。

  之后,Cutting再接再厉,在Lucene的基础上将开源的思想之后深化。2004年,Cutting和同为程序员名门的MikeCafarella要求研发一款可以替换当时的主流搜寻产品的开源搜索引擎,这个项目被命名为Nutch。

在此之前,Cutting所在的公司Architext(其主要产品为Excite搜索引擎)因没顶着互联网经济泡沫的冲击而倒闭,那时的Cutting于是以处在Freelancer的生涯中,所以他期望自己的项目能通过一种较低支出的方式来建构网页中的大量算法。幸运地的是,Google这时正好公布了一项研究报告,报告中讲解了两款Google为反对自家的搜索引擎而研发的软件平台。这两个平台一个是GFS(GoogleFileSystem),用作存储有所不同设备所产生的海量数据;另一个是MapReduce,它运营在GFS之上,负责管理分布式大规模数据。

基于这两个平台,Cutting最引人瞩目的作品Hadoop问世了(后来大家习惯指出Hadoop于2006年1月28日问世的)。谈及Google对他们的协助,Cutting说道:我们开始设想用4~5台电脑来构建这个项目,但在实际运营中涉及了大量繁复的步骤必须靠人工来已完成。

Google的平台让这些步骤以求自动化,为我们构建整体框架奠定了较好的基础。  想起Google,Cutting也是它茁壮的见证人之一,这里有一段鲜为人知的故事。早在Cutting供职于Architext期间,有两个年轻人曾去造访这家公司,并向他们贩卖自己的搜寻技术,但当时他们的Demo只检索出有几百万条网页,Excite的工程师们实在他们的技术过于小儿科,于是就在心里痛恨一番,把他们给带走了。

但故事未到此结束,这两个年轻人回来之后痛定思痛,要求自己创业。于是,他们进了一家自己的搜寻公司,取名为Google。

宝马游戏官方网站

这两个年轻人就是LarryPage和SergeyBrin。在Cutting显然,Google的顺利主要各不相同,偏移排序之后再行存储的设计和对自己技术的热情。  出于对时间成本的考虑到,在从Architext辞职四年后,Cutting要求完结这段Freelancer的生涯,去找一家靠谱的公司,更进一步完备Hadoop的性能。他先后试镜了几家公司,其中也还包括IBM,但IBM或许对他的早期项目Lucene更加感兴趣,至于Hadoop则不置可否。

就在此时,Cutting拒绝接受了当时Yahoo!搜寻项目负责人RaymieStata的邀,于2006年月重新加入Yahoo!。在Yahoo!,有一支一百人的团队协助他完备Hadoop项目,这期间研发工作展开得卓有成效。

旋即之后,Yahoo!就宣告,将其旗下的搜寻业务的架构迁入到Hadoop上来。两年后,Yahoo!之后基于Hadoop启动了第一个应用于项目webmap一个用来计算出来网页间链接关系的算法。Cutting的时任上司(后为HortonworksCEO)EricBaldeschwieler曾说道:在完全相同的硬件环境下,基于Hadoop的webmap的反应速度是之前系统的33倍。

  谈及顺利,Cutting指出他的顺利主要得益于两点,一是对自己工作的热情(Cutting在大学时就开始做到Infrastracture类的程序,他用Lisp为Emacs贡献过代码,他十分讨厌自己的程序被千万人用于的感觉);二是目标不要以定得过大,要踏踏实实,一步一个脚印。  现在早已被业内称作Hadoop之父的Cutting在Hadoop10年回到之时发表文章:HadoopAt10:DougCuttingOnMakingBigDataWork。InfoQ翻译成了中文(原文内容,翻译成)。让我们一起想到他眼中的大数据技术的未来是怎么样的?  (换为本人描述模式)2016年1月28日,是Hadoop问世十周年。

此纪念日既给与了我们机会去庆典过去10年来ApacheHadoop所获得的变革,也让我们反省是如何获得今天的一切成就,同时以便更佳地规划未来的发展目标。  Hadoop是为了大数据而问世的,其本身就象征物着本世纪工业革命的焦点:业务的数字化转型。十年前,数字化业务意味着在少数几个行业中获得了应用于,例如电子商务和媒体。从那时起,我们早已看见数字化技术将沦为完全所有行业必不可少的一环。

每一个行业都正在致力于环绕其信息系统建构数据驱动型运营模式。像Hadoop之类的大数据工具可以使各行业需要从他们所产生的数据中取得仅次于的利益。  Hadoop本身并非是数字化转型的显然起因,但是它是推展这种发展趋势的最重要因素。因此,通过追溯到Hadoop的发展历史,可以更佳地理解我们现在所处的世纪。


本文关键词:Hadoop,十岁,DougCutting,成长史,他眼,中大,数据,宝马游戏官方网站

本文来源:宝马游戏官方网站-www.pgmfjm.cn

咨询电话
0697-304668959
公司地址:江苏省南京市玄武区玄武湖
邮箱:admin@pgmfjm.cn
淘宝店铺:
Copyright © 2006-2023 www.pgmfjm.cn. 宝马游戏官方网站科技 版权所有 ICP备49180772号-3