|
1. 论文题目:The Anatomy of a Large-Scale Hypertextual Web Search Engine
论文作者:Sergey brin, Lawrence Page (1998)
介绍: 这篇论文是Google的创始人布林和佩奇。 文章介绍了Google大型搜索引擎的原型,论文解决了以下问题,包括如何运用超文本中的附加信息,建立一个大型实用系统。任何人都可以在网上随意发布信息,如何有效地处理这些无组织的超文本体例,等等。
2. 论文题目:The Google File System
论文作者:Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung (2003)
介绍: Sanjay等是毕业于麻省理工的博士,他们设计并实施了Google文件系统(GFS),这是一个可扩展的大型数据密集型应用的分布式文件系统。论文介绍了GFS为支持分布式应用是如何去做接口扩展设计的,并从技术的基准和标准以及现实应用的使用体验等多方面来讨论文件系统设计的各个层面,数据存储和处理是如何监控和管理,等等。
3. 论文题目:MapReduce: Simplified Data Processing on Large Clusters
论文作者:Jeffrey Dean and Sanjay Ghemawat(2004)
介绍: 作为MapReduce的奠基文章,该论文详细介绍了基于MapReduce的健在式编程模式,这一模式,可以说是云计算技术实现的灵魂。目前Google将MapReduce运行于其成千上万台云计算的普通PC节点上,并且具有非常高效的可扩展性。读者可以通过对于这篇论文的阅读来初窥MapReduce编程模式的门径,并从中走入云计算编程的自由天地。
4. 论文题目:Bigtable: A Distributed Storage System for Structured Data.
论文作者:Fay Chang, Jeffry Dean, Sanjay Ghemawat, etc. (2006)
介绍: 关于BigTable,是一种创新型的分布式数据库,其设计用来针对海量数据处理情形下的管理结构型数据方面具有着巨大的技术优势。目前的Google地球,网页索引等都是基于BigTable实现。这篇论文介绍了BigTable支持的数据模型,这样的数据模型可以在数据部署和数据构成上进行动态数据管理,同可,文集也详细介绍了BigTable的设计思路以及实现方法。通过该论文的学习,读者可以尝试按照这样的思路和方法处理海量的结构化数据以达到高效的互联网体验。
作者:preterhuman_peak 发表于2012-5-19 18:31:15 原文链接
|
|