合办方
顶级赞助商
钻石赞助商
白金助商
赞助商
赞助合作

如果有意赞助O'Reilly Velocity China 2011或者有其他合作想法,请通过地址donna at mail.oreilly.com.cn联系马女士。

Sponsorship Opportunities Outside China

For Velocity China sponsorship information for companies outside China, contact Yvonne Romaine at yromaine@oreilly.com

刘洪清
系统程序员 豆瓣

2007年毕业于清华大学电机系,现就职于豆瓣网,从事架构和平台相关工作,BeansDB和 Dpark的作者,为改善豆瓣五千多万用户的使用体验而努力。热爱技术,尤其关注实现服务器端大容量、分布式、高性能、高可用等相关技术。做事追求简单和极致,用简洁的手法解决复杂问题。

发言
 
2011-12-07 14:30
支持迭代计算的MapReduce框架
永泰大宴会厅B 

MapReduce 类框架在大规模数据计算上有很好的伸缩性,但在实现需要迭代类算法时效率比较低。UC Berkeley 的 AMP 实验室设计并实现了 Spark 来解决迭代计算问题,是用 Scala 实现的,建立在通用的计算资源调度框架 Mesos 之上。Dpark 是 Spark 的 Python 克隆,实现了 Spark 的绝大部分特性,使得可以直接用 Python 进行 MapReduce或者迭代式计算,Spark 的优雅设计使得它非常灵活,并具有跟高的扩展能力和性能。豆瓣正在积极尝试用它来取代Hadoop和部分MPI 来实现日志分析和各种数值计算,会分享一下这方面的心得体会。