大型分布式网站架构设计与实践试读有感 -

wangmuming1122

浏览: 11228 次
性别:
来自: 南京

最近访客更多访客>>

婉秋三生

华家小谁

chenyinghg

qilin543210

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

大型分布式网站架构设计与实践试读有感

博客分类：

阅读感想

感想

书中提到了很多大型分布式网站设计所必须的知识点，如soa、分布式系统的基础设施，系统稳定性设计，数据分析，系统稳定设计的章节写的很有实践性，自检脚本的编写、日志分析命令的妙用，这些知识虽然之前都听过，但是运用的不熟练，看目录书中应该有很多实际的案例，另外互联网安全方面之前讲类似知识点的书也比较少，书中介绍的比较详细，不错，赞一个。

关于试读“分布式系统的基础设施”这一章，个人看我后，感觉介绍的很不错，基础知识方面基本都有涉及。memcache、hbase 这些基于nosql的DB在大数据方面应用是很不错的选择。
像hbase：
半结构化或非结构化数据,对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用HBase。当业务发展需要存储author的email，phone，address信息时RDBMS需要停机维护，而HBase支持动态增加.

记录非常稀疏
RDBMS的行有多少列是固定的，为null的列浪费了存储空间。而如上文提到的，HBase为null的Column不会被存储，这样既节省了空间又提高了读性能。

多版本数据
如上文提到的根据Row key和Column key定位到的Value可以有任意数量的版本值，因此对于需要存储变动历史记录的数据，用HBase就非常方便了。比如上例中的author的Address是会变动的，业务上一般只需要最新的值，但有时可能需要查询到历史值。

超大数据量
当数据量越来越大，RDBMS数据库撑不住了，就出现了读写分离策略，通过一个Master专门负责写操作，多个Slave负责读操作，服务器成本倍增。随着压力增加，Master撑不住了，这时就要分库了，把关联不大的数据分开部署，一些join查询不能用了，需要借助中间层。随着数据量的进一步增加，一个表的记录越来越大，查询就变得很慢，于是又得搞分表，比如按ID取模分成多个表以减少单个表的记录数。经历过这些事的人都知道过程是多么的折腾。采用HBase就简单了，只需要加机器即可，HBase会自动水平切分扩展，跟Hadoop的无缝集成保障了其数据可靠性（HDFS）和海量数据分析的高性能（MapReduce）。

分享到：

试读《京东技术解密》后的一些感触 | JBPM5.4安装报Eclipse下载地址找不到

2014-10-08 14:49
浏览 685
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大型分布式网站架构设计与实践试读有感

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大型分布式网站架构设计与实践 试读有感

评论

发表评论

相关推荐

《程序员面试宝典（第5版）》试读

《Java程序员面试宝典（第4版）》试读

《Node.js实战（第2季）》试读感想

试读《架构探险——从零开始写Java Web框架》

《 React：引领未来的用户界面开发框架》 试读

《 Netty权威指南（第2版）》 学习感悟

试读《Node.js项目实践：构建可扩展的Web应用》感悟

试读《京东技术解密》后的一些感触

最近访客更多访客>>

大型分布式网站架构设计与实践试读有感

《 React：引领未来的用户界面开发框架》试读

《 Netty权威指南（第2版）》学习感悟