科技网

当前位置: 首页 >新闻

阿里邮箱在5分钟里实现给飞行中的飞机换引白

新闻
来源: 作者: 2019-02-13 23:05:45

在6月23日阿里邮箱的产品发布会上,阿里邮箱产品负责人张紫徽说了这么一个段子:我第一次向当时的老板提出要做邮箱时,我老板回答:做邮箱?我家的邮箱都长草了。

2009年,阿里邮箱团队成立,当时它的名字还是阿里云邮。七年之后,这个曾被认为会长草的邮箱产品以突破100万的企业用户数成为国内企业邮箱市场第一,完成超300次迭代,并且更名阿里邮箱完成升级。

佘智勇是邮箱团队中呆满整七年的技术专家,做邮箱产品的幕幕在他的记忆里仍然清晰。

2014年,为了满足越来越多企业用户提出的需求,阿里邮箱曾经历过一次大规模的数据库迁移,数据量涉及数P,数据库记录达数百亿条,这样大规模的数据迁移在当时的阿里巴巴都属罕见。

阿里邮箱在5分钟里实现给飞行中的飞机换引白

为了平稳迁移,把对用户的影响降到最小,阿里邮箱对用户承诺只停服5分钟,5分钟后便可以正常使用。

佘智勇回忆,在约5个月的前期准备之后,邮箱团队进入了数据库迁移的攻坚战。每次数据搬运约需3天,3天后便进入数据校验环节,而为了实现对用户的承诺,团队必须在5分钟内完成数百亿条数据的校验工作。

这就好比在给一架飞行中的飞机换引擎,如果处理不当就会坠毁。而在我们迁移数据的过程中,这架飞机坠毁了无数次。佘智勇说,很多次,到了最后几分钟,校验程序验证数据不对,如果要继续核查,我们的停服时间就会超出5分钟。为了不影响用户体验,每次我们都选择从头来过,再等3天。

等3天,校验数据,数据不对,放弃从头来过,再等3天这样的状态延续了整整两个月。

疲乏,是邮箱团队当时的状态,但是迁移数据库的工作还在继续。

最后一次验证,验证工具报错,数百亿条数据中有2条数据不对。怎么办?在最后一分钟,团队中一位不停以人肉校对数据的同学突然发现,验证工具存在bug。千钧一发的时候,我们决定切新数据库,而事实证明,所有的数据的确都对了。

类似的紧急情况还出现过无数次,而为了一个功能、一个图标,团队开会时拍桌走人的情况也不少见。

关于阿里邮箱未来的发展方向,佘智勇说:邮箱最大的特点是跨平台、跨公司,阿里邮箱就是要发挥邮箱的这个特点,更加彻底地开即使错误也被当时美丽的光环吸引着禁不住靠近放自己,让邮箱成为更高频的产品,连接更多,不止于邮箱。

常州到宿州
雅马哈快艇马达报价
动漫女孩手绘图片

相关推荐