<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Bookcold&#039;s Blog &#187; 网络</title>
	<atom:link href="http://bookcold.com/category/network/feed" rel="self" type="application/rss+xml" />
	<link>http://bookcold.com</link>
	<description>Just for pleasure</description>
	<lastBuildDate>Thu, 09 Sep 2010 06:49:28 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>图文细说Google数据中心</title>
		<link>http://bookcold.com/2010/08/582</link>
		<comments>http://bookcold.com/2010/08/582#comments</comments>
		<pubDate>Fri, 20 Aug 2010 11:03:56 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[网络]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[数据中心]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/08/582</guid>
		<description><![CDATA[<p>&#160;</p> <p> <p>转自：http://www.cnbeta.com/articles/119876.htm</p> <p>Google数据中心分布图 Google 搜索速度为什么能这么快？这主要因为Google在全球分布着众多的数据中心。根据现有信息，如果包括在建的数据中心，Google共有36个数据中心。 其中美国有19个、欧洲12个、俄罗斯1个、南美1个和亚洲3个（北京-Google.cn、香港-Google.com.hk和东京各1个）。不 过，Google也并非完全独享这些数据中心，他们也向其他公司出租空间。</p> <p> 图1：Google数据中心-全球 图 2：Google数据中心-北美 图3：Google数据中心-欧洲</p> <p>Google的第一个“数据中心”</p> <p> 图4：Google的第一个“数据中心”&#8211;BackRub</p> <p>Google 的首个“数据中心”是在佩恩的宿舍楼。一句话概括：麻雀虽小，五脏俱全。详细配置请看《成名之前的Google：斯坦福大学期间的Backrub原貌》 数据中心的服务器 大部分公司都是向Dell、HP、IBM和SUN厂商直接购买服务器。购买服务器需要一大笔费用，如果 Google的服务器均从其他公司购买，估计Google也无法有今天。时至今日，Google的所有服务器均为自己一手打造。Google服务器厚度 3.5寸，2U（两机柜式），它有2个CPU、2个硬盘，采用技嘉主板，有8个内存插槽。Google采用AMD与英特尔的x86处理器。在同样大的空间 内，Google的服务器比其他厂商的服务器能容纳更多的CPU。</p> <p> 图5-1：Google服务器 图5-2：“世纪互联”机房中谷歌的一组服务器(DELL Precision 390 工作站)</p> <p>数据中心以集装箱为单位，每个集装箱里面有1160台服务器，每个数据 中心有众多集装箱。 数据中心的核心技术 Google一直都钟情于开源软件，也一直支持开源技术 （Google对手之一的Facebook也同样重视开源技术）。Google服务器使用的是Linux操作系统。Google的工程师按照平行计算的要 求对Linux进行了优化。Google开发自有核心软件，开发语言是Java和C++。 Google的三大核心元素：</p> Google 文件系统（GFS）；（GFS负责服务器数据储存工作） Google大表；Bigtable：是Google一种对于半结构化数据进行 分布存储与访问的接口或服务）；由于Google的文件系统异常庞大，以至于甲骨文和IBM公司的商业数据库在方面无用武之地。另外，商业数据库都是按 CPU数量来收费，如果Google使用商业数据库，可想而知，这是一笔天文数字。所以，Google量体裁衣地设计了符合自身的大表。 Mapreduce 算法；它是Google开发的C++编程工具，用于大于1TB数据的大规模数据集并行运算。MapReduce能够找出一个词语在Google搜索目录中 出现的次数；一系列网页中特定词语出现的频率；链接到某个特定网站的所有网站数量等。 <p> 虽然Google依靠许多开源项目实现了企业的腾飞，但Google始终对这三大核心元素保密。 数据中心的专利 服务器内置电池。 每台服务器都有一颗12伏特电，确保万一主断源断电时还可持续供电。最终目的，节约成本。 可移动的数据中心集装箱。2008年10月获得该项专利，每个集装箱中最多可容纳1160台服务器。 <p> 数据中心的开销 根据Google的盈利报告，2006年Google在数据中心上的开销是19亿美元，2007年是24 亿，2008年23.6亿，2009年8亿9百万，2010年上半年已开销7亿1千5百万。 [...]]]></description>
			<content:encoded><![CDATA[<p>&#160;</p>
<p> <span id="more-582"></span>
<p><b>转自：<a href="http://www.cnbeta.com/articles/119876.htm">http://www.cnbeta.com/articles/119876.htm</a></b></p>
<p><b>Google数据中心分布图</b>    <br />Google 搜索速度为什么能这么快？这主要因为Google在全球分布着众多的数据中心。根据现有信息，如果包括在建的数据中心，Google共有36个数据中心。 其中美国有19个、欧洲12个、俄罗斯1个、南美1个和亚洲3个（北京-Google.cn、香港-Google.com.hk和东京各1个）。不 过，Google也并非完全独享这些数据中心，他们也向其他公司出租空间。</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=888&amp;d=1282138586"><img title="Google数据中心-全球  伯乐在线 - 职场博客" border="0" alt="Google数据中心-全球  伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=888&amp;d=1282138586" /></a>    <br />图1：Google数据中心-全球    <br /><a href="http://forum.jobbole.com/attachment.php?attachmentid=884&amp;d=1282138548"><img title="Google数据中心-北美 伯乐在线 - 职场博客" border="0" alt="Google数据中心-北美 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=884&amp;d=1282138548" /></a>    <br />图 2：Google数据中心-北美    <br /><a href="http://forum.jobbole.com/attachment.php?attachmentid=887&amp;d=1282138577"><img title="Google数据中心-欧洲 伯乐在线 - 职场博客" border="0" alt="Google数据中心-欧洲 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=887&amp;d=1282138577" /></a>    <br />图3：Google数据中心-欧洲</p>
<p><b>Google的第一个“数据中心”</b></p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=883&amp;d=1282138544"><img title="Google的第一个“数据中心”--BackRub  伯乐在线 - 职场博客" border="0" alt="Google的第一个“数据中心”--BackRub  伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=883&amp;d=1279776715" /></a>    <br />图4：Google的第一个“数据中心”&#8211;BackRub</p>
<p>Google 的首个“数据中心”是在佩恩的宿舍楼。一句话概括：麻雀虽小，五脏俱全。详细配置请看《<a href="http://forum.jobbole.com/entry.php/91">成名之前的Google：斯坦福大学期间的Backrub原貌</a>》    <br /><b>数据中心的服务器</b>    <br />大部分公司都是向Dell、HP、IBM和SUN厂商直接购买服务器。购买服务器需要一大笔费用，如果 Google的服务器均从其他公司购买，估计Google也无法有今天。时至今日，Google的所有服务器均为自己一手打造。Google服务器厚度 3.5寸，2U（两机柜式），它有2个CPU、2个硬盘，采用技嘉主板，有8个内存插槽。Google采用AMD与英特尔的x86处理器。在同样大的空间 内，Google的服务器比其他厂商的服务器能容纳更多的CPU。</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=889&amp;d=1282178239"><img title="Google服务器 伯乐在线-职场博客" border="0" alt="Google服务器 伯乐在线-职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=889&amp;d=1282178239" /></a>    <br />图5-1：Google服务器    <br /><a href="http://forum.jobbole.com/attachment.php?attachmentid=876&amp;d=1282131821"><img title="谷歌的一组服务器 伯乐在线 - 职场博客" border="0" alt="谷歌的一组服务器 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=876&amp;d=1282131821" /></a>    <br />图5-2：“世纪互联”机房中谷歌的一组服务器(DELL Precision 390 工作站)</p>
<p>数据中心以集装箱为单位，每个集装箱里面有1160台服务器，每个数据 中心有众多集装箱。   <br /><b>数据中心的核心技术</b>    <br />Google一直都钟情于开源软件，也一直支持开源技术 （Google对手之一的<a href="http://forum.jobbole.com/entry.php/73">Facebook也同样重视开源技术</a>）。Google服务器使用的是Linux操作系统。Google的工程师按照平行计算的要 求对Linux进行了优化。Google开发自有核心软件，开发语言是Java和C++。    <br />Google的三大核心元素：</p>
<ol>
<li><b>Google 文件系统</b>（GFS）；（GFS负责服务器数据储存工作） </li>
<li><b>Google大表</b>；Bigtable：是Google一种对于半结构化数据进行 分布存储与访问的接口或服务）；由于Google的文件系统异常庞大，以至于甲骨文和IBM公司的商业数据库在方面无用武之地。另外，商业数据库都是按 CPU数量来收费，如果Google使用商业数据库，可想而知，这是一笔天文数字。所以，Google量体裁衣地设计了符合自身的大表。 </li>
<li><b>Mapreduce 算法</b>；它是Google开发的C++编程工具，用于大于1TB数据的大规模数据集并行运算。MapReduce能够找出一个词语在Google搜索目录中 出现的次数；一系列网页中特定词语出现的频率；链接到某个特定网站的所有网站数量等。</li>
</ol>
<p> 虽然Google依靠许多开源项目实现了企业的腾飞，但Google始终对这三大核心元素保密。  <br /><b>数据中心的专利</b>
<ol>
<li><b>服务器内置电池</b>。 每台服务器都有一颗12伏特电，确保万一主断源断电时还可持续供电。最终目的，节约成本。 </li>
<li><b>可移动的数据中心集装箱</b>。2008年10月获得该项专利，每个集装箱中最多可容纳1160台服务器。</li>
</ol>
<p> <b>数据中心的开销</b>  <br />根据Google的盈利报告，2006年Google在数据中心上的开销是19亿美元，2007年是24 亿，2008年23.6亿，2009年8亿9百万，2010年上半年已开销7亿1千5百万。
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=877&amp;d=1282132042"><img title="Google数据中心“烧钱”曲线图 伯乐在线 - 职场博客" border="0" alt="Google数据中心“烧钱”曲线图 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=877&amp;d=1282132042" /></a>    <br />图7：Google数据中心“烧钱”曲线图</p>
<p><b>数据中心的选址标准</b></p>
<ol>
<li>大量的廉价电力； </li>
<li>绿色能源，更注重可再生能源； </li>
<li>靠近河流或湖泊；（设备冷却需要大量水源） </li>
<li>用地广阔；（隐秘性和安全性） </li>
<li>和其他数据中心的距离；（数据中心之间的快速链接） </li>
<li>税收优惠。</li>
</ol>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=878&amp;d=1282132088"><img title="Google 服务器 伯乐在线 - 职场博客" border="0" alt="Google 服务器 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=878&amp;d=1282132088" /></a>    <br />图8：Google的服务器（左）Google俄勒冈州Dalles数据中心（中）Google 服务器机柜特写（右）</p>
<p><b>Google的特殊数据中心</b>——<b>圣吉兰数据中心</b>    <br />Google在比利时的圣吉兰（Saint Ghislain）数据中心(图3中编号26)根本没有冷却装置，完全依靠纯自然冷却（即：用数据中心外面的新鲜空气来支持冷却系统）。一般来说，绝大部 分数据中心都是采用水冷却装置。（这也就是为什么数据中心选址时要考虑水源。）</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=885&amp;d=1282138556"><img title="Google比利时数据中心 伯乐在线-职场博客" border="0" alt="Google比利时数据中心 伯乐在线-职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=885&amp;d=1282138556" /></a>    <br />图9：Google比利时数据中心    <br /><a href="http://forum.jobbole.com/attachment.php?attachmentid=886&amp;d=1282138560"><img title="比利时国王参观Google比利时数据中心   伯乐在线 - 职场博客" border="0" alt="比利时国王参观Google比利时数据中心   伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=886&amp;d=1282138560" /></a>    <br />图10：比利时国王(左五)参观Google比利时数据中心</p>
<p><b>Google的Dalles(达尔斯)数据中心</b>    <br />Dalles数据中心(图2中编号8)位于俄勒冈州的波特兰以东约80英里，旁边是哥伦比亚河，河上有座大坝——Dalles大坝，大坝为数据中心提供便 宜的电力。数据中心有2座4层楼高的冷却塔。（注：“Dalles”不是“Dallas”，Dallas达拉斯在德州。）</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=890&amp;d=1282179761"><img title="Dalles数据中心鸟瞰图 伯乐在线-职场博客" border="0" alt="Dalles数据中心鸟瞰图 伯乐在线-职场博客" src="http://forum.jobbole.com/attachment.php?attachmentid=890&amp;d=1282179761" /></a>    <br />图11：Dalles数据中心鸟瞰图</p>
<p> 以下这段话来自Nicholasg Carr，他曾经在2009年访问Dalles数据中。蓝色部分是关关的注释。</p>
<p>Dalles数据中心有3个超大机房（在图11中有4个白色建筑，但只有3个是服务器机房），每个机房有45个集装箱，每个集装箱可以放置1160台服务器，故Dalles数据中心可以存放约15万台服务器。   <br /><strong>Google的秘密</strong>    <br />Google在其数据中心的位置和数量方面的保密工作做得很好。比如说：如果你反查Google各种爬虫或者是Google各个域名的IP地址，所得结果 几乎看起来都是加州山景城的IP地址。因此，想通过反查IP地址，基本无法推断出其数据中心的真正位置和真正数量。    <br />此外，Google通常把其数据中心“伪装”成有限责任公司， 表明上看起来和Google毫无瓜葛。比如：北卡罗来纳州Lapis公司和爱荷华州的Tetra公司。    <br />既然Google在其数据中心方面的保密工作做得很出色，所以本文的信息未必是百分百正确。</p>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/08/582/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google的十大核心技术</title>
		<link>http://bookcold.com/2010/08/578</link>
		<comments>http://bookcold.com/2010/08/578#comments</comments>
		<pubDate>Wed, 18 Aug 2010 04:23:40 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[网络]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[分布式]]></category>
		<category><![CDATA[数据]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/08/578</guid>
		<description><![CDATA[<p>转自：http://www.dbanotes.net/arch/google_app_engine_arch.html</p> <p>本系列是基于公开资料对Google App Engine是如何实现的这个话题进行深度探讨。而且在切入Google App Engine之前，首先会对Google的核心技术和其整体架构进行分析，以帮助大家之后更好地理解Google App Engine的实现。</p> <p>本篇将主要介绍Google的十个核心技术，而且可以分为四大类：</p> 式基础设施：GFS，Chubby和Protocol Buffer。 分布式大规模数据处理：MapReduce和Sawzall。 分布式数据库技术：BigTable和数据库Sharding。 数据中心优化技术：数据中心高温化，12V电池和服务器整合。 <p> <p>&#160;</p> 分布式基础设施 <p>GFS</p> <p>由于搜索引擎需要处理海量的数据，所以Google的两位创始人Larry Page和Sergey Brin在创业初期设计一套名为“BigFiles”的文件系统，而GFS（全称为“Google File System”）这套分布式文件系统则是“BigFiles”的延续。</p> <p>首先，介绍它的架构，GFS主要分为两类节点：</p> ster节点：主要存储与数据文件相关的元数据，而不是Chunk（数据块）。元数据包括一个能将64位标签映射到数据块的位置及其组成文件 的表格，数据块副本位置和哪个进程正在读写特定的数据块等。还有Master节点会周期性地接收从每个Chunk节点来的更新（”Heart- beat”）来让元数据保持最新状态。 Chunk节点：顾名思义，肯定用来存储Chunk，数据文件通过被分割为每个默认大小为64MB的Chunk的方式存储，而且每个Chunk有 唯一一个64位标签，并且每个Chunk都会在整个分布式系统被复制多次，默认为3次。 <p>下图就是GFS的架构图：</p> <p></p> <p>图1. GFS的架构图（参片[15]）</p> <p>接着，在设计上，GFS主要有八个特点：</p> 文件和大数据块：数据文件的大小普遍在GB级别，而且其每个数据块默认大小为64MB，这样做的好处是减少了元数据的大小，能使Master节 点能够非常方便地将元数据放置在内存中以提升访问效率。 操作以添加为主：因为文件很少被删减或者覆盖，通常只是进行添加或者读取操作，这样能充分考虑到硬盘线性吞吐量大和随机读写慢的特点。 支持容错：首先，虽然当时为了设计方便，采用了单Master的方案，但是整个系统会保证每个Master都会有其相对应的复制品，以便于在 Master节点出现问题时进行切换。其次，在Chunk层，GFS已经在设计上将节点失败视为常态，所以能非常好地处理Chunk节点失效的问题。 高吞吐量：虽然其单个节点的性能无论是从吞吐量还是延迟都很普通，但因为其支持上千的节点，所以总的数据吞吐量是非常惊人的。 保护数据：首先，文件被分割成固定尺寸的数据块以便于保存，而且每个数据块都会被系统复制三份。 扩展能力强：因为元数据偏小，使得一个Master节点能控制上千个存数据的Chunk节点。 支持压缩：对于那些稍旧的文件，可以通过对它进行压缩，来节省硬盘空间，并且压缩率非常惊人，有时甚至接近90%。 用户空间：虽然在用户空间运行在运行效率方面稍差，但是更便于开发和测试，还有能更好利用Linux的自带的一些POSIX API。 <p>现在Google内部至少运行着200多个GFS集群，最大的集群有几千台服务器，并且服务于多个Google服务，比如 Google搜索。但由于GFS主要为搜索而设计，所以不是很适合新的一些Google产品，比YouTube、Gmail和更强调大规模索引和实时性的 Caffeine搜索引擎等，所以Google已经在开发下一代GFS，代号为“Colossus”，并且在设计方面有许多不同，比如：支持分布式 Master节点来提升高可用性并能支撑更多文件，chunk节点能支持1MB大小的chunk以支撑低延迟应用的需要。</p> <p>Chubby</p> <p>简单的来说，Chubby属于分布式锁服务，通过Chubby，一个分布式系统中的上千个client都能够对于某项资源进行“加锁”或者“解 锁”，常用于BigTable的协作工作，在实现方面是通过对文件的创建操作来实现“加锁”，并基于著名科学家Leslie Lamport的Paxos算法。</p> <p>Protocol [...]]]></description>
			<content:encoded><![CDATA[<p>转自：<a href="http://www.dbanotes.net/arch/google_app_engine_arch.html">http://www.dbanotes.net/arch/google_app_engine_arch.html</a></p>
<p>本系列是基于公开资料对Google App Engine是如何实现的这个话题进行深度探讨。而且在切入Google App Engine之前，首先会对Google的核心技术和其整体架构进行分析，以帮助大家之后更好地理解Google App Engine的实现。</p>
<p>本篇将主要介绍Google的十个核心技术，而且可以分为四大类：</p>
<ol>
<li>
<ol>
<li>式基础设施：GFS，Chubby和Protocol Buffer。 </li>
<li>分布式大规模数据处理：MapReduce和Sawzall。 </li>
<li>分布式数据库技术：BigTable和数据库Sharding。 </li>
<li>数据中心优化技术：数据中心高温化，12V电池和服务器整合。 </li>
</ol>
</li>
</ol>
<p> <span id="more-578"></span>
<p>&#160;</p>
<h3>分布式基础设施</h3>
<p><strong>GFS</strong></p>
<p>由于搜索引擎需要处理海量的数据，所以Google的两位创始人Larry Page和Sergey Brin在创业初期设计一套名为“BigFiles”的文件系统，而GFS（全称为“Google File System”）这套分布式文件系统则是“BigFiles”的延续。</p>
<p>首先，介绍它的架构，GFS主要分为两类节点：</p>
<ol>
<li>
<ol>
<li>ster节点：主要存储与数据文件相关的元数据，而不是Chunk（数据块）。元数据包括一个能将64位标签映射到数据块的位置及其组成文件 的表格，数据块副本位置和哪个进程正在读写特定的数据块等。还有Master节点会周期性地接收从每个Chunk节点来的更新（”Heart- beat”）来让元数据保持最新状态。 </li>
<li>Chunk节点：顾名思义，肯定用来存储Chunk，数据文件通过被分割为每个默认大小为64MB的Chunk的方式存储，而且每个Chunk有 唯一一个64位标签，并且每个Chunk都会在整个分布式系统被复制多次，默认为3次。 </li>
</ol>
</li>
</ol>
<p>下图就是GFS的架构图：</p>
<p><a href="http://vbqnmw.blu.livefilestore.com/y1pYrD2A3-IfgpT-nHa1rPjSJnj4Bss4-OhCPqak-45BMfHLfFxcF4d1hAsCPbZMYf668FHOddTV71_CejbwbDUe76vOG5GWuws/Google-file-system.png"><img title="GFS Architecture" border="0" alt="GFS  Architecture" src="http://vbqnmw.blu.livefilestore.com/y1pYrD2A3-IfgpT-nHa1rPjSJnj4Bss4-OhCPqak-45BMfHLfFxcF4d1hAsCPbZMYf668FHOddTV71_CejbwbDUe76vOG5GWuws/Google-file-system.png" width="536" height="243" /></a></p>
<p>图1. GFS的架构图（参片[15]）</p>
<p>接着，在设计上，GFS主要有八个特点：</p>
<ol>
<li>
<ol>
<li>文件和大数据块：数据文件的大小普遍在GB级别，而且其每个数据块默认大小为64MB，这样做的好处是减少了元数据的大小，能使Master节 点能够非常方便地将元数据放置在内存中以提升访问效率。 </li>
<li>操作以添加为主：因为文件很少被删减或者覆盖，通常只是进行添加或者读取操作，这样能充分考虑到硬盘线性吞吐量大和随机读写慢的特点。 </li>
<li>支持容错：首先，虽然当时为了设计方便，采用了单Master的方案，但是整个系统会保证每个Master都会有其相对应的复制品，以便于在 Master节点出现问题时进行切换。其次，在Chunk层，GFS已经在设计上将节点失败视为常态，所以能非常好地处理Chunk节点失效的问题。 </li>
<li>高吞吐量：虽然其单个节点的性能无论是从吞吐量还是延迟都很普通，但因为其支持上千的节点，所以总的数据吞吐量是非常惊人的。 </li>
<li>保护数据：首先，文件被分割成固定尺寸的数据块以便于保存，而且每个数据块都会被系统复制三份。 </li>
<li>扩展能力强：因为元数据偏小，使得一个Master节点能控制上千个存数据的Chunk节点。 </li>
<li>支持压缩：对于那些稍旧的文件，可以通过对它进行压缩，来节省硬盘空间，并且压缩率非常惊人，有时甚至接近90%。 </li>
<li>用户空间：虽然在用户空间运行在运行效率方面稍差，但是更便于开发和测试，还有能更好利用Linux的自带的一些POSIX API。 </li>
</ol>
</li>
</ol>
<blockquote><p>现在Google内部至少运行着200多个GFS集群，最大的集群有几千台服务器，并且服务于多个Google服务，比如 Google搜索。但由于GFS主要为搜索而设计，所以不是很适合新的一些Google产品，比YouTube、Gmail和更强调大规模索引和实时性的 Caffeine搜索引擎等，所以Google已经在开发下一代GFS，代号为“Colossus”，并且在设计方面有许多不同，比如：支持分布式 Master节点来提升高可用性并能支撑更多文件，chunk节点能支持1MB大小的chunk以支撑低延迟应用的需要。</p>
</blockquote>
<p><strong>Chubby</strong></p>
<p>简单的来说，Chubby属于分布式锁服务，通过Chubby，一个分布式系统中的上千个client都能够对于某项资源进行“加锁”或者“解 锁”，常用于BigTable的协作工作，在实现方面是通过对文件的创建操作来实现“加锁”，并基于著名科学家Leslie Lamport的Paxos算法。</p>
<p><strong>Protocol Buffer</strong></p>
<p>Protocol Buffer，是Google内部使用一种语言中立，平台中立和可扩展的序列化结构化数据的方式，并提供java、c++ 和python这三种语言的实现，每一种实现都包含了相应语言的编译器以及库文件，而且它是一种二进制的格式，所以其速度是使用xml进行数据交换的10 倍左右。它主要用于两个方面：其一是RPC通信，它可用于分布式应用之间或者异构环境下的通信。其二是数据存储方面，因为它自描述，而且压缩很方便，所以 可用于对数据进行持久化，比如存储日志信息，并可被Map Reduce程序处理。与Protocol Buffer比较类似的产品还有Facebook的Thrift，而且Facebook号称Thrift在速度上还有一定的优势。</p>
<p><strong></strong></p>
<h3>分布式大规模数据处理</h3>
<p><strong>MapReduce</strong></p>
<blockquote><p>首先，在Google数据中心会有大规模数据需要处理，比如被网络爬虫（Web Crawler）抓取的大量网页等。由于这些数据很多都是PB级别，导致处理工作不得不尽可能的并行化，而Google为了解决这个问题，引入了 MapReduce这个编程模型，MapReduce是源自函数式语言，主要通过”Map（映射）”和”Reduce（化简）”这两个步骤来并行处理大规 模的数据集。Map会先对由很多独立元素组成的逻辑列表中的每一个元素进行指定的操作，且原始列表不会被更改，会创建多个新的列表来保存Map的处理结 果。也就意味着，Map操作是高度并行的。当Map工作完成之后，系统会先对新生成的多个列表进行清理（Shuffle）和排序，之后会这些新创建的列表 进行Reduce操作，也就是对一个列表中的元素根据Key值进行适当的合并。</p>
<p>下图为MapReduce的运行机制：</p>
</blockquote>
<p><a href="http://public.blu.livefilestore.com/y1pd56Dd5Z-lvqPcZMorM_KCk02rcCLXnwrESBFoKvLE25MCN5OWmaLvvt_Jn9jnOGXu1VcEm3CeJp0F7QsH2XN2Q/Map%20Reduce.PNG"><img title="Map Reduce" border="0" alt="Map Reduce" src="http://public.blu.livefilestore.com/y1pd56Dd5Z-lvqPcZMorM_KCk02rcCLXnwrESBFoKvLE25MCN5OWmaLvvt_Jn9jnOGXu1VcEm3CeJp0F7QsH2XN2Q/Map%20Reduce.PNG" width="572" height="412" /></a></p>
<p>图2. MapReduce的运行机制（参[19]）</p>
<blockquote><p>接下来，将根据上图来举一个MapReduce的例子：比如，通过搜索Spider将海量的Web页面抓取到本地的GFS 集群中，然后Index系统将会对这个GFS集群中多个数据Chunk进行平行的Map处理，生成多个Key为URL，value为html页面的键值对 （Key-Value Map），接着系统会对这些刚生成的键值对进行Shuffle（清理），之后系统会通过Reduce操作来根据相同的key值（也就是URL）合并这些键 值对。</p>
</blockquote>
<p>最后，通过MapReduce这么简单的编程模型，不仅能用于处理大规模数据，而且能将很多繁琐的细节隐藏起来，比如自动并行化，负载均衡和机器宕 机处理等，这样将极大地简化程序员的开发工作。MapReduce可用于包括“分布grep，分布排序，web访问日志分析，反向索引构建，文档聚类，机 器学习，基于统计的机器翻译，生成Google的整个搜索的索引“等大规模数据处理工作。Yahoo也推出MapReduce的开源版本Hadoop，而 且Hadoop在业界也已经被大规模使用。</p>
<p><strong>Sawzall</strong></p>
<p>Sawzall可以被认为是构建在MapReduce之上的采用类似Java语法的DSL（Domain-Specific Language），也可以认为它是分布式的AWK。它主要用于对大规模分布式数据进行筛选和聚合等高级数据处理操作，在实现方面，是通过解释器将其转化 为相对应的MapReduce任务。除了Google的Sawzall之外，yahoo推出了相似的Pig语言，但其语法类似于SQL。</p>
<p><strong></strong></p>
<p><strong></strong></p>
<p><strong></strong></p>
<h3>分布式数据库技术</h3>
<p><strong>BigTable</strong></p>
<p>由于在Google的数据中心存储PB级以上的非关系型数据时候，比如网页和地理数据等，为了更好地存储和利用这些数据，Google开发了一套数 据库系统，名为“BigTable”。BigTable不是一个关系型的数据库，它也不支持关联（join）等高级SQL操作，取而代之的是多级映射的数 据结构，并是一种面向大规模处理、容错性强的自我管理系统，拥有TB级的内存和PB级的存储能力，使用结构化的文件来存储数据，并每秒可以处理数百万的读 写操作。</p>
<p>什么是多级映射的数据结构呢？就是一个稀疏的，多维的，排序的Map，每个Cell由行关键字，列关键字和时间戳三维定位．Cell的内容是一个不 解释的字符串，比如下表存储每个网站的内容与被其他网站的反向连接的文本。 反向的URL com.cnn.www是这行的关键字；contents列存储网页内容，每个内容有一个时间戳，因为有两个反向连接，所以archor的Column Family有两列：anchor: cnnsi.com和anchhor:my.look.ca。Column Family这个概念，使得表可以轻松地横向扩展。下面是它具体的数据模型图：</p>
<p><img title="Big Table Data Model" border="0" alt="Big Table Data Model" src="http://vbqnmw.blu.livefilestore.com/y1pMpu9fDZ9JIML9crpkzBJDFHhrvKxuJtJ2yrv8XMUWr948PknwcbEhRq5esPkaxvDJKUXnwxh7eJBgmJ91k-CsLMHeDzzqgwB/Big%20Table%20Model.PNG" width="604" height="143" /></p>
<p>图3. BigTable数据模型图（参[4]）</p>
<p>在结构上，首先，BigTable基于GFS分布式文件系统和Chubby分布式锁服务。其次BigTable也分为两部分：其一是Master节 点，用来处理元数据相关的操作并支持负载均衡。其二是tablet节点，主要用于存储数据库的分片tablet，并提供相应的数据访问，同时tablet 是基于名为SSTable的格式，对压缩有很好的支持。</p>
<p><a href="http://public.blu.livefilestore.com/y1pnNu6NW7p_u0ubd09DSGedH5M2R1yO9JBt3wvLW9w6rSF5ZiOlCJZXIg37zC9r_9ROrCqoD3hAm7yJa6Io3vcGA/BigTable.PNG"><img title="Big Table Architecture" border="0" alt="Big Table  Architecture" src="http://public.blu.livefilestore.com/y1pnNu6NW7p_u0ubd09DSGedH5M2R1yO9JBt3wvLW9w6rSF5ZiOlCJZXIg37zC9r_9ROrCqoD3hAm7yJa6Io3vcGA/BigTable.PNG" width="543" height="315" /></a></p>
<p>图4. BigTable架构图（参[15]）</p>
<p>BigTable正在为Google六十多种产品和项目提供存储和获取结构化数据的支撑平台，其中包括有Google Print， Orkut，Google Maps，Google Earth和Blogger等，而且Google至少运行着500个BigTable集群。</p>
<blockquote><p>随着Google内部服务对需求的不断提高和技术的不断地发展，导致原先的BigTable已经无法满足用户的需求，而 Google也正在开发下一代BigTable，名为“Spanner（扳手）”，它主要有下面这些BigTable所无法支持的特性：</p>
</blockquote>
<ol>
<li>
<ol>
<li>持多种数据结构，比如table，familie，group和coprocessor等。 </li>
<li>基于分层目录和行的细粒度的复制和权限管理。 </li>
<li>支持跨数据中心的强一致性和弱一致性控制。 </li>
<li>基于Paxos算法的强一致性副本同步，并支持分布式事务。 </li>
<li>提供许多自动化操作。 </li>
<li>强大的扩展能力，能支持百万台服务器级别的集群。 </li>
<li>用户可以自定义诸如延迟和复制次数等重要参数以适应不同的需求。 </li>
</ol>
</li>
</ol>
<p><strong>数据库Sharding</strong></p>
<blockquote><p>Sharding就是分片的意思，虽然非关系型数据库比如BigTable在Google的世界中占有非常重要的地位，但 是面对传统OLTP应用，比如广告系统，Google还是采用传统的关系型数据库技术，也就是MySQL，同时由于Google所需要面对流量非常巨大， 所以Google在数据库层采用了分片（Sharding）的水平扩展（Scale Out）解决方案，分片是在传统垂直扩展（Scale Up）的分区模式上的一种提升，主要通过时间，范围和面向服务等方式来将一个大型的数据库分成多片，并且这些数据片可以跨越多个数据库和服务器来实现水平 扩展。</p>
<p>Google整套数据库分片技术主要有下面这些优点：</p>
</blockquote>
<ol>
<li>
<ol>
<li>展性强：在Google生产环境中，已经有支持上千台服务器的MySQL分片集群。 </li>
<li>吞吐量惊人：通过巨大的MySQL分片集群能满足巨量的查询请求。 </li>
<li>全球备份：不仅在一个数据中心还是在全球的范围，Google都会对MySQL的分片数据进行备份，这样不仅能保护数据，而且方便扩展。 </li>
</ol>
</li>
</ol>
<p>在实现方面，主要可分为两块：其一是在MySQL InnoDB基础上添加了数据库分片的技术。其二是在ORM层的Hibernate的基础上也添加了相关的分片技术，并支持虚拟分片（Virtual Shard）来便于开发和管理。同时Google也已经将这两方面的代码提交给相关组织。</p>
<h3>数据中心优化技术</h3>
<p><strong></strong></p>
<p><strong></strong></p>
<p><strong></strong></p>
<p><strong>数据中心高温化</strong></p>
<p>大中型数据中心的PUE（Power Usage Effectiveness）普遍在2左右，也就是在服务器等计算设备上耗1度电，在空调等辅助设备上也要消耗一度电。对一些非常出色的数据中心，最多也 就能达到1.7，但是Google通过一些有效的设计使部分数据中心到达了业界领先的1.2，在这些设计当中，其中最有特色的莫过于数据中心高温化，也就 是让数据中心内的计算设备运行在偏高的温度下，Google的能源方面的总监Erik Teetzel在谈到这点的时候说：“普通的数据中心在70华氏度（21摄氏度）下面工作，而我们则推荐80华氏度（27摄氏度）“。但是在提高数据中心 的温度方面会有两个常见的限制条件：其一是服务器设备的崩溃点，其二是精确的温度控制。如果做好这两点，数据中心就能够在高温下工作，因为假设数据中心的 管理员能对数据中心的温度进行正负1/2度的调节，这将使服务器设备能在崩溃点5度之内工作，而不是常见的20度之内，这样既经济，又安全。还有，业界传 言Intel为Google提供抗高温设计的定制芯片，但云计算界的顶级专家James Hamilton认为不太可能，因为虽然处理器也非常惧怕热量，但是与内存和硬盘相比还是强很多，所以处理器在抗高温设计中并不是一个核心因素。同时他也 非常支持使数据中心高温化这个想法，而且期望将来数据中心甚至能运行在40摄氏度下，这样不仅能节省空调方面的成本，而且对环境也很有利。</p>
<h3><strong></strong></h3>
<p><strong>12V电池</strong></p>
<blockquote><p>由于传统的UPS在资源方面比较浪费，所以Google在这方面另辟蹊径，采用了给每台服务器配一个专用的12V电池的做 法来替换了常用的UPS，如果主电源系统出现故障，将由该电池负责对服务器供电。虽然大型UPS可以达到92%到95%的效率，但是比起内置电池的 99.99%而言是非常捉襟见肘的，而且由于能量守恒的原因，导致那么未被UPS充分利用的电力会被转化成热能，这将导致用于空调的能耗相应地攀升，从而 走入一个恶性循环。同时在电源方面也有类似的“神来之笔”，普通的服务器电源会同时提供5V和12V的直流电。但是Google设计的服务器电源只输出 12V直流电，必要的转换在主板上进行，虽然这种设计会使主板的成本增加1美元到2美元，但是它不仅能使电源能在接近其峰值容量的情况下运行，而且在铜线 上传输电流时效率更高。</p>
</blockquote>
<p><strong>服务器整合</strong></p>
<p>谈到虚拟化的杀手锏时，第一个让人想到肯定是服务器整合，而且普遍能实现1:8的整合率来降低各方面的成本。有趣的是，Google在硬件方面也引 入类似服务器整合的想法，它的做法是在一个机箱大小的空间内放置两台服务器，这些做的好处有很多，首先，减小了占地面积。其次，通过让两台服务器共享诸如 电源等设备，来降低设备和能源等方面的投入。</p>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/08/578/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>互联网历史上15个划时代的&#8220;第一&#8221;</title>
		<link>http://bookcold.com/2010/08/575</link>
		<comments>http://bookcold.com/2010/08/575#comments</comments>
		<pubDate>Sat, 07 Aug 2010 11:26:43 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[杂七杂八]]></category>
		<category><![CDATA[网络]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/08/575</guid>
		<description><![CDATA[<p> <p>互联网之所以能发展到今日之现状，并且融入到我们的日常生活，这都应归功于那些开拓者和创新者。 回首1876年3月10日，亚历山大·格雷厄姆·贝尔先生拨通了世界上的“第一”个电话，说：“沃森先生，请到这里来，我要见您。” 看完这个世界“第一”，我们肯定也想回头看看互联网上发生的已改变我们生活方式的事件。伯乐在线-职场博客的这篇文章精心挑选一些非常有趣的“第一”事件，以和大家分享。（上篇仅说7个“第一”） 互联网历史上的15个的“第一”，分成三部分：互联网、网站和网络服务 互联网方面的“第一” 第一封邮件 1971年，雷·汤姆林逊发出了世界上的第一封邮件。另外，邮件地址中的用来分隔用户名和机器名（那时候还没有“域名”这一说法）的@符号也是他引入的。尽管在20世纪60年代就有类似的系统，但该系统仅限于同类型机器之间通信。直到1971年，才有了现代邮件的雏形，邮件才能通过网络传输。请注意，这时候还没有互联网哦，但互联网的前身——ARPANET已经存在了。 第一封邮件是在加州的洛杉矶大学和斯坦福大学之间传送的。很可惜的是，接收两封邮件后，计算机就崩溃了。</p> <p> 图1: 当年发送第一封邮件的计算机</p> <p>第一个域名 在互联网上第一个注册的域名是“symbolics.com”。1985年3月15日，由Symbolics计算机制造公司注册的（该公司现已解散）。2009年，该域名出售给XF.com投资公司，具体数额不详。</p> <p> 图2： symbolics.com网站25周年截图</p> <p>第一封垃圾邮件 首次有记载的垃圾消息是在1978年5月3日，由DEC公司的营销人员Gary Thuerk通过ARPANET发送给393位接收人。这封邮件是DEC公司的新计算机模型的广告邮件。换句话说，Gary Thuerk“荣获”了世界上首位垃圾邮件发送者的称号。这甚至还为他赢得吉尼斯世界纪录。不过在1978年的时候还没有“垃圾邮件（Spam）”这个词。 第一款上网手机 1996年在芬兰，诺基亚9000通讯器连接到互联网。但当时手机上网费用的非常昂贵，限制了经营者。1999年，日本的NTT DoCoMO公司推出i-Mode，公认的互联网手机服务才诞生了。</p> <p> 图3： 诺基亚9000通讯器</p> <p>网站方面的“第一” 第一个网站 1990年年末，第一个网站info.cern.ch横空出世，它运行在欧洲核子研究中心（CERN）的NeXT计算机上。第一个网页的地址是：http://info.cern.ch/hypertext/WWW/TheProject.html ，此网页的内容是关于万维网计划的。info.cern.ch网站上已经删除这个页面。</p> <p> 图4： 第一个冲浪者、第一台Web服务器和第一个站长</p> <p>第一个电子商务网站（和第一笔交易） 尽管Amazon和eBay闻名外中，但它们并非是第一家电子商务网站。在线零售网站NetMarket宣称，互联网上的第一笔安全交易是它们完成的。1994年8月11日，该网站以12.48美元（含运费）出售了Sting的Ten Summoner’s Tales的CD拷贝碟。Internet Shopping Network是另外一个竞争第一个商务网站“皇冠”的竞争者，该网站自称，它们的第一笔交易比NetMarket整整早了一个月。</p> <p> 图5： NetMarket Logo</p> <p>第一家网络银行 斯坦福联邦信用社（SFCU）是一个联邦特许成立的信用社，它在1959年成立于加利福尼亚州的帕洛阿尔托。它主要向斯坦福大学社区提供金融服务。迄今为止，SFCU拥有超过10亿美元的资产和超过4万7千个会员。1994年，SFCU开通其网络银行服务。从此，世界上的第一家网络银行就此诞生。</p> <p> 图6： 斯坦福联邦信用社 Logo</p> <p>第一个搜索引擎 虽然互联网搜索引擎比万维网出现早，但当时它们的功能有限，仅能解析网页标题。第一个全文搜索引擎是1994年的上线的WebCrawler。</p> <p> 图8： [...]]]></description>
			<content:encoded><![CDATA[<p><span id="more-575"></span>
<p><b>互联网之所以能发展到今日之现状，并且融入到我们的日常生活，这都应归功于那些开拓者和创新者。</b>    <br /> 回首1876年3月10日，亚历山大·格雷厄姆·贝尔先生拨通了世界上的“第一”个电话，说：“沃森先生，请到这里来，我要见您。” 看完这个世界“第一”，我们肯定也想回头看看互联网上发生的已改变我们生活方式的事件。伯乐在线-职场博客的这篇文章精心挑选一些非常有趣的“第一”事件，以和大家分享。（上篇仅说7个“第一”）    <br /> 互联网历史上的15个的“第一”，分成三部分：互联网、网站和网络服务    <br /><b>互联网方面的“第一”</b>    <br /><b>第一封邮件</b>    <br /> 1971年，雷·汤姆林逊发出了世界上的第一封邮件。另外，邮件地址中的用来分隔用户名和机器名（那时候还没有“域名”这一说法）的@符号也是他引入的。尽管在20世纪60年代就有类似的系统，但该系统仅限于同类型机器之间通信。直到1971年，才有了现代邮件的雏形，邮件才能通过网络传输。请注意，这时候还没有互联网哦，但互联网的前身——ARPANET已经存在了。    <br /> 第一封邮件是在加州的洛杉矶大学和斯坦福大学之间传送的。很可惜的是，接收两封邮件后，计算机就崩溃了。</p>
<p><img title="名称:  001.jpg&#13;&#10;查看次数: 969&#13;&#10;文件大小:  23.6 KB" border="0" alt="名称:  001.jpg&#13;&#10;查看次数: 969&#13;&#10;文件大小:  23.6 KB" src="http://forum.jobbole.com/attachment.php?attachmentid=706&amp;d=1280314944" />    <br />图1: 当年发送第一封邮件的计算机</p>
<p><b>第一个域名</b>    <br /> 在互联网上第一个注册的域名是“symbolics.com”。1985年3月15日，由Symbolics计算机制造公司注册的（该公司现已解散）。2009年，该域名出售给XF.com投资公司，具体数额不详。</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=707&amp;d=1280314952"><img title="点击图片以查看大图&#13;&#10;&#13;&#10;名称:	002.jpg&#13;&#10;查看次数:	200&#13;&#10;文件大小:	11.2 KB&#13;&#10;ID:	707" border="0" alt="点击图片以查看大图&#13;&#10;&#13;&#10;名称:	002.jpg&#13;&#10;查看次数:	200&#13;&#10;文件大小:	11.2 KB&#13;&#10;ID:	707" src="http://forum.jobbole.com/attachment.php?attachmentid=707&amp;d=1280068707&amp;thumb=1" /></a>    <br />图2： symbolics.com网站25周年截图</p>
<p><b>第一封垃圾邮件</b>    <br /> 首次有记载的垃圾消息是在1978年5月3日，由DEC公司的营销人员Gary Thuerk通过ARPANET发送给393位接收人。这封邮件是DEC公司的新计算机模型的广告邮件。换句话说，Gary Thuerk“荣获”了世界上首位垃圾邮件发送者的称号。这甚至还为他赢得吉尼斯世界纪录。不过在1978年的时候还没有“垃圾邮件（Spam）”这个词。    <br /><b>第一款上网手机</b>    <br /> 1996年在芬兰，诺基亚9000通讯器连接到互联网。但当时手机上网费用的非常昂贵，限制了经营者。1999年，日本的NTT DoCoMO公司推出i-Mode，公认的互联网手机服务才诞生了。</p>
<p><img title="名称:  003.jpg&#13;&#10;查看次数: 924&#13;&#10;文件大小:  18.0 KB" border="0" alt="名称:  003.jpg&#13;&#10;查看次数: 924&#13;&#10;文件大小:  18.0 KB" src="http://forum.jobbole.com/attachment.php?attachmentid=708&amp;d=1280314961" />    <br />图3： 诺基亚9000通讯器</p>
<p><b>网站方面的“第一”</b>    <br /><b>第一个网站</b>    <br /> 1990年年末，第一个网站info.cern.ch横空出世，它运行在欧洲核子研究中心（CERN）的NeXT计算机上。第一个网页的地址是：<a href="http://info.cern.ch/hypertext/WWW/TheProject.html">http://info.cern.ch/hypertext/WWW/TheProject.html</a> ，此网页的内容是关于万维网计划的。info.cern.ch网站上已经删除这个页面。</p>
<p><a href="http://forum.jobbole.com/attachment.php?attachmentid=709&amp;d=1280314972"><img title="点击图片以查看大图&#13;&#10;&#13;&#10;名称:	004.jpg&#13;&#10;查看次数:	6&#13;&#10;文件大小:	39.6 KB&#13;&#10;ID:	709" border="0" alt="点击图片以查看大图&#13;&#10;&#13;&#10;名称:	004.jpg&#13;&#10;查看次数:	6&#13;&#10;文件大小:	39.6 KB&#13;&#10;ID:	709" src="http://forum.jobbole.com/attachment.php?attachmentid=709&amp;d=1280068799&amp;thumb=1" /></a>    <br />图4： 第一个冲浪者、第一台Web服务器和第一个站长</p>
<p><b>第一个电子商务网站（和第一笔交易）</b>    <br /> 尽管Amazon和eBay闻名外中，但它们并非是第一家电子商务网站。在线零售网站NetMarket宣称，互联网上的第一笔安全交易是它们完成的。1994年8月11日，该网站以12.48美元（含运费）出售了Sting的Ten Summoner’s Tales的CD拷贝碟。Internet Shopping Network是另外一个竞争第一个商务网站“皇冠”的竞争者，该网站自称，它们的第一笔交易比NetMarket整整早了一个月。</p>
<p><img title="名称:  005.gif&#13;&#10;查看次数: 541&#13;&#10;文件大小:  2.6 KB" border="0" alt="名称:  005.gif&#13;&#10;查看次数: 541&#13;&#10;文件大小:  2.6 KB" src="http://forum.jobbole.com/attachment.php?attachmentid=710&amp;d=1280314985" />    <br />图5： NetMarket Logo</p>
<p><b>第一家网络银行</b>    <br /> 斯坦福联邦信用社（SFCU）是一个联邦特许成立的信用社，它在1959年成立于加利福尼亚州的帕洛阿尔托。它主要向斯坦福大学社区提供金融服务。迄今为止，SFCU拥有超过10亿美元的资产和超过4万7千个会员。1994年，SFCU开通其网络银行服务。从此，世界上的第一家网络银行就此诞生。</p>
<p><img title="名称:  006.jpg&#13;&#10;查看次数: 543&#13;&#10;文件大小:  6.9 KB" border="0" alt="名称:  006.jpg&#13;&#10;查看次数: 543&#13;&#10;文件大小:  6.9 KB" src="http://forum.jobbole.com/attachment.php?attachmentid=711&amp;d=1280314997" />    <br />图6： 斯坦福联邦信用社 Logo</p>
<p><b>第一个搜索引擎</b>    <br /> 虽然互联网搜索引擎比万维网出现早，但当时它们的功能有限，仅能解析网页标题。第一个全文搜索引擎是1994年的上线的WebCrawler。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=766&amp;d=1281086857"><img title="1996年期间的WebCrawler 伯乐在线 - 职场博客" border="0" alt="1996年期间的WebCrawler 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=766&amp;d=1280970540" /></a>    <br />图8： 1996年期间的WebCrawler</p>
<p><b>第一个博客</b>    <br /> 1994年，贾斯汀·霍尔搭建一个基于网络的日记平台，称为“贾斯汀的链接”。虽然该日记提供早期互联网的上网指南，但随着时间推移，日记变得越来越个人化。纽约时报杂志曾介绍他是“个人博客之父”。当然了，当时还没所谓“blog”一词。（“weblog”出现于1997年，在1999年才演变为“blog”。）</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=764&amp;d=1281086855"><img title="个人博客之父——贾斯汀·霍尔 伯乐在线 - 职场博客" border="0" alt="个人博客之父——贾斯汀·霍尔 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=764&amp;d=1280970757" /></a>    <br />图9： 个人博客之父——贾斯汀·霍尔 （一名自由职业记者）</p>
<p><b>第一个播客</b>    <br /> 2000年10月，在经过一番讨论后，“博客先驱”——戴夫·温纳增强RSS功能——把声音内容加入到RSS种子中，以便聚合声音博客。2001年1月11日，温纳在他的脚本新闻博客中展示了新的RSS功能，他在RSS中添加了一首Grateful Dead组合的歌曲。2003年，播客才开始流行。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=770&amp;d=1281086862"><img title="“博客先驱”——戴夫·温纳 伯乐在线 - 职场博客" border="0" alt="“博客先驱”——戴夫·温纳 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=770&amp;d=1280971148" /></a>    <br />图10： “博客先驱”——戴夫·温纳</p>
<p><b>网络服务方面的第一</b>    <br /><b>eBay卖出的第一件货物</b>    <br /> 1995年，eBay成立，当时的名称还是“AuctionWeb”。eBay卖出的第一件货物是一个14.83美元的损坏了的激光指示器。当eBay的创始人Pierre Omidyar致信买家询问他是否注意到指示器是坏的，买家回复说“我专门收集坏的激光指示器”。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=763&amp;d=1281086854"><img title="eBay logo 伯乐在线 - 职场博客" border="0" alt="eBay logo 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=763&amp;d=1280971542" /></a>    <br />图11： eBay logo</p>
<p><b>Amazon卖出的第一本书</b>    <br /> 1995年，Amazon上线。Amazon卖出的第一本书是道格拉斯·霍夫斯塔特的《Fluid Concepts and Creative Analogies: Computer Models of the Fundamental Mechanisms of Thought》。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=765&amp;d=1281086856"><img title="Amazon logo 伯乐在线 - 职场博客" border="0" alt="Amazon logo 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=765&amp;d=1280971638" /></a>    <br />图12： Amazon logo</p>
<p><b>维基/百科上的第一个词条</b>    <br /> 维基/百科上的第一个词条是由创始人吉米·威尔斯编辑的一个测试词条——“Hello，World！”，这个词条不久后便删除了。维基/百科上现存最早的词条是在2001年1月16日编辑的国家列表。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=768&amp;d=1281086860"><img title="维基/百科 Logo 伯乐在线 - 职场博客" border="0" alt="维基/百科 Logo 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=768&amp;d=1280971849" /></a>    <br />图13： 维基/百科 Logo</p>
<p><b>YouTube上的第一段视频</b>    <br /> 2005年4月23日，Youtube的联合创始人Jawed Karim上传YouTube的第一段视频。</p>
<ul>
<li>视频名称：《Me at the zoo》，Jawed Karim拍摄于圣地亚哥动物园。 </li>
<li>浏览次数：已超过150万 </li>
<li>尚能看否：是，不过要翻墙</li>
</ul>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=769&amp;d=1281086861"><img title="YouTube Logo 伯乐在线 - 职场博客" border="0" alt="YouTube Logo 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=769&amp;d=1280971879" /></a>    <br />图14： YouTube Logo</p>
<p><b>Twitter上的第一条消息（即：第一声“鸟叫”）</b>    <br /> 2006年3月21日，Twitter的开发者兼联合创始人Jack Dorsey写下了第一条消息：“just setting up my twttr”。“twttr”并不是错字。Twitter曾在短期内被称作“twttr”，这个词的灵感部分源于“Flickr”，另外部分原因是：“twttr”是5个字符，可以作为一个SMS简短代码使用。</p>
<p><a href="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=767&amp;d=1281086858"><img title="Twitter上的第一条消息 伯乐在线 - 职场博客" border="0" alt="Twitter上的第一条消息 伯乐在线 - 职场博客" src="http://forum.jobbole.com/attachment.php?s=b85d095a5396a48e64f4ddc465c9b9f4&amp;attachmentid=767&amp;d=1280972031" /></a>    <br />图15： Twitter上的第一条消息</p>
<p>转自：<a href="http://blog.jobbole.com/entry.php/108">http://blog.jobbole.com/entry.php/108</a></p>
<p>&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; <a href="http://forum.jobbole.com/entry.php/99">http://forum.jobbole.com/entry.php/99</a></p>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/08/575/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>云计算思维导图</title>
		<link>http://bookcold.com/2010/07/554</link>
		<comments>http://bookcold.com/2010/07/554#comments</comments>
		<pubDate>Wed, 14 Jul 2010 06:37:05 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[网络]]></category>
		<category><![CDATA[Cloud Computing]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/07/554</guid>
		<description><![CDATA[<p> </p> </p> <p>&#160;</p> <p>来自：http://broadcast.oreilly.com/2010/06/cloud-computing-mind-map.html</p> ]]></description>
			<content:encoded><![CDATA[<p><a href="http://bookcold.com/wp-content/uploads/2010/07/CloudComputing.jpg"><img style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="Cloud-Computing" border="0" alt="Cloud-Computing" src="http://bookcold.com/wp-content/uploads/2010/07/CloudComputing_thumb.jpg" width="444" height="398" /></a> </p>
</p>
<p>&#160;</p>
<p>来自：<a href="http://broadcast.oreilly.com/2010/06/cloud-computing-mind-map.html">http://broadcast.oreilly.com/2010/06/cloud-computing-mind-map.html</a></p>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/07/554/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>超出图灵机的云计算</title>
		<link>http://bookcold.com/2010/07/551</link>
		<comments>http://bookcold.com/2010/07/551#comments</comments>
		<pubDate>Sat, 10 Jul 2010 03:29:24 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[网络]]></category>
		<category><![CDATA[Cloud Computing]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/07/551</guid>
		<description><![CDATA[云计算(李德毅院士) View more presentations from ikewu83. </p> ]]></description>
			<content:encoded><![CDATA[<div style="width: 425px" id="__ss_4680035"><strong style="margin: 12px 0px 4px; display: block"><a title="云计算091124(李德毅院士)" href="http://www.slideshare.net/ikewu83/091124">云计算(李德毅院士)</a></strong><object id="__sse4680035" width="425" height="355"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=091124-100705030155-phpapp01&amp;stripped_title=091124" /><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><embed name="__sse4680035" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=091124-100705030155-phpapp01&amp;stripped_title=091124" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object>
<div style="padding-bottom: 12px; padding-left: 0px; padding-right: 0px; padding-top: 5px">View more <a href="http://www.slideshare.net/">presentations</a> from <a href="http://www.slideshare.net/ikewu83">ikewu83</a>.</div>
</p></div>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/07/551/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hadoop设计时的几点假设</title>
		<link>http://bookcold.com/2010/06/542</link>
		<comments>http://bookcold.com/2010/06/542#comments</comments>
		<pubDate>Fri, 18 Jun 2010 11:00:48 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[系统架构]]></category>
		<category><![CDATA[网络]]></category>
		<category><![CDATA[Hadoop]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/06/542</guid>
		<description><![CDATA[ 服务器失效时正常的。 存储和处理的数据是海量的。 文件不会被频繁写入和修改。 机柜内的数据传输速度大于机柜间的数据传输速度。 海量数据的情况下移动计算比移动数据高效。 ]]></description>
			<content:encoded><![CDATA[<ol>
<li>服务器失效时正常的。</li>
<li>存储和处理的数据是海量的。</li>
<li>文件不会被频繁写入和修改。</li>
<li>机柜内的数据传输速度大于机柜间的数据传输速度。</li>
<li>海量数据的情况下移动计算比移动数据高效。</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/06/542/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>【转】漫谈虚拟化技术</title>
		<link>http://bookcold.com/2010/06/541</link>
		<comments>http://bookcold.com/2010/06/541#comments</comments>
		<pubDate>Tue, 15 Jun 2010 15:14:53 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[网络]]></category>
		<category><![CDATA[虚拟化]]></category>

		<guid isPermaLink="false">http://bookcold.com/2010/06/541</guid>
		<description><![CDATA[<p>相当不错的系列：</p> 剖析系统虚拟化（1）- 简介 剖析系统虚拟化（2）- X86虚拟化技术 剖析系统虚拟化（3）- VMware vSphere 的简介 剖析系统虚拟化（4）- VMware ESX 架构 剖析系统虚拟化（5）- Virtual Networking 的简介 剖析系统虚拟化（6）- Virtual Switch 的主要功能 ]]></description>
			<content:encoded><![CDATA[<p>相当不错的系列：</p>
<ol>
<li><a href="http://www.tektalk.org/2010/04/11/%e5%89%96%e6%9e%90%e7%b3%bb%e7%bb%9f%e8%99%9a%e6%8b%9f%e5%8c%96%ef%bc%881%ef%bc%89-%e7%ae%80%e4%bb%8b/">剖析系统虚拟化（1）- 简介</a></li>
<li><a href="http://www.tektalk.org/2010/04/12/%E5%89%96%E6%9E%90%E7%B3%BB%E7%BB%9F%E8%99%9A%E6%8B%9F%E5%8C%96%EF%BC%882%EF%BC%89-x86%E8%99%9A%E6%8B%9F%E5%8C%96%E6%8A%80%E6%9C%AF/" target="_blank">剖析系统虚拟化（2）- X86虚拟化技术</a> </li>
<li><a href="http://www.tektalk.org/2010/04/25/%e5%89%96%e6%9e%90%e7%b3%bb%e7%bb%9f%e8%99%9a%e6%8b%9f%e5%8c%96%ef%bc%883%ef%bc%89-vmware-vsphere-%e7%9a%84%e7%ae%80%e4%bb%8b/">剖析系统虚拟化（3）- VMware vSphere 的简介</a></li>
<li><a href="http://www.tektalk.org/2010/04/27/%e5%89%96%e6%9e%90%e7%b3%bb%e7%bb%9f%e8%99%9a%e6%8b%9f%e5%8c%96%ef%bc%884%ef%bc%89-vmware-esx-%e6%9e%b6%e6%9e%84/">剖析系统虚拟化（4）- VMware ESX 架构</a></li>
<li><a href="http://www.tektalk.org/2010/05/02/%e5%89%96%e6%9e%90%e7%b3%bb%e7%bb%9f%e8%99%9a%e6%8b%9f%e5%8c%96%ef%bc%885%ef%bc%89-virtual-networking-%e7%9a%84%e7%ae%80%e4%bb%8b/">剖析系统虚拟化（5）- Virtual Networking 的简介</a></li>
<li><a href="http://www.tektalk.org/2010/05/10/%e5%89%96%e6%9e%90%e7%b3%bb%e7%bb%9f%e8%99%9a%e6%8b%9f%e5%8c%96%ef%bc%886%ef%bc%89-virtual-switch-%e7%9a%84%e4%b8%bb%e8%a6%81%e5%8a%9f%e8%83%bd/">剖析系统虚拟化（6）- Virtual Switch 的主要功能</a></li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/06/541/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>FxxK G*F*W</title>
		<link>http://bookcold.com/2010/05/481</link>
		<comments>http://bookcold.com/2010/05/481#comments</comments>
		<pubDate>Sun, 30 May 2010 15:24:34 +0000</pubDate>
		<dc:creator>bookcold</dc:creator>
				<category><![CDATA[杂七杂八]]></category>
		<category><![CDATA[网络]]></category>

		<guid isPermaLink="false">http://bookcold.com/?p=481</guid>
		<description><![CDATA[Fxxk gfw</p> View more presentations from bookcold yuan. ]]></description>
			<content:encoded><![CDATA[<div id="__ss_4354933" style="width: 425px;"><strong><a title="Fxxk gfw" href="http://www.slideshare.net/bookcold/fxxk-gfw">Fxxk gfw</a></strong><object id="__sse4354933" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="355" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=fxxkgfw-100530101835-phpapp02&amp;stripped_title=fxxk-gfw" /><param name="name" value="__sse4354933" /><param name="allowfullscreen" value="true" /><embed id="__sse4354933" type="application/x-shockwave-flash" width="425" height="355" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=fxxkgfw-100530101835-phpapp02&amp;stripped_title=fxxk-gfw" name="__sse4354933" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>
<div style="padding: 5px 0 12px;">View more <a href="http://www.slideshare.net/">presentations</a> from <a href="http://www.slideshare.net/bookcold">bookcold yuan</a>.</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://bookcold.com/2010/05/481/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->