人类已进入大数据时代,数据的增长超乎人类想象。
每天,我们忙着生产新的数据。全球社交网络每小时传播的图片超过1亿张,每天超过30亿张。2019年,Youtube每分钟上传的视频超过500个小时,相当于每天要上传72万小时的影片。如果人们把这些影像都浏览一遍,至少要花上80年。
每天,我们忙着用数据来做事。早些年聊天软件安装包只有几十兆大小,到现在已升至几百兆。在使用过程中,单个社交软件所占用的内存空间,动辄就几个GB。
强迫症人士看着难受。
要知道,阿波罗登月计划中使用的计算机,运行内存(RAM)只有2kb,而固定内存(ROM)也只有36kb。为了降低计算机的运行压力,当时每一行代码都优化到极致,这和现在臃肿的手机应用相比,简直是天差地别。
大数据浪潮下,全球数据规模飞涨,中国也不例外。2016年中国数据规模为4000ZB(注:1ZB约为10亿GB),到了2020年达到64000ZB,5年内增长了15倍。
当前互联网的数据量为ZB级别。
看似无形的数据囤积,不仅逼着普通人频繁“换新”、制造更多电子垃圾,而且会带来巨大的碳排放,威胁全球环境。
据英国《新科学家》杂志报道,传输和观看在线视频每年产生3亿吨二氧化碳排放,占全球碳排量的1%。而根据国际能源协会(IEA)的统计数据,2019年疫情前的航空运输业的碳排量,也仅占全球碳排放总量的2%左右。
听多了元宇宙,我们容易忽略数据的存储和传输,是会消耗惊人电量的。截至2020年底,中国数据中心耗电量已突破2000亿千瓦时,能耗占全国总用电量的2.7%。
在确保防洪、航运和水资源利用的前提下,三峡电站在2020年全年累计生产电能1118亿千瓦时。这意味着当年我国数据中心的耗电量,几乎相当于两个三峡电站的发电量。
三峡水电站。/视觉中国
数据中心的高能耗不是我国独有的现象。从微观上看,一个超大型数据中心动辄上万台服务器,每年的耗电量为亿度级别。从宏观上看,全世界数据中心的年耗电规模,已超过2000亿度。
数据中心是5G、人工智能和云计算等新一代信息通信技术的重要载体,堪称“数字经济发动机”。按照中国国家发改委的统计,互联网行业数据中心,每消耗一度电可带动超过30元的行业收入,为钢铁行业的近两倍。
大数据和云计算的结合应用,还能帮助其它领域精准减碳。据市场研究权威机构IDC的计算,2020年全球使用云计算减少的二氧化碳总量,相当于减少了近2600万辆燃油汽车上路。
全球云计算二氧化碳减排预测。/IDC
我们不能“唯耗电论”而直接给数据中心扣帽子,但也不能不想办法提升数据中心的能源效率。
PUE是国际公认的数据中心能耗评价指标,计算方法为数据中心消耗的所有能源与IT设备能耗的比值,理想值是1。现实中,每个数据中心都要在服务器的冷却上想办法。
为了便于散热,全球不少大型数据中心选址在你意想不到的地方:
Meta(前为“脸书”)把数据中心安在高寒的北极圈附近;腾讯的数据中心跑到贵州凉爽的山洞中;阿里巴巴则喜欢把数据中心“泡”在水里,例如浙江千岛湖和广东万绿湖,直接用深层湖水制冷。
贵州贵安,建在山里的腾讯数据中心。/视觉中国
除了选址在凉快的地方,数据中心还在努力提升清洁能源的使用比例。使用风能、太阳能、水能、地热能等可再生能源,取代化石燃料发电。2013年前,中国超大型数据中心的平均PUE超过1.7,如今这个平均值为1.46,实现大幅度提升。
数据中心在追求极致的能耗比,但并不意味着数据就越多越好。
我们生成的数据,有些本身就是数字污染物。就像垃圾信息一样,有些数据毫无用处,像是手机里重复的照片、网盘里正吃着灰的资源。有些数据不仅没用,还会产生潜在的害处,例如应用程序获取的浏览记录和位置信息。
有些数据最好用完即弃。/视觉中国
博尔赫斯的小说《博闻强记的富内斯》里,主角富内斯拥有扫描仪般的记忆力。这种纤毫不差、未经选择的记忆,让他陷入了无尽的痛苦,以至于其感叹"我的记忆正如垃圾倾倒场”。
无用的信息记录下来,是一种负担。既然有的数据用不着还占内存,我们何不在点击拍摄按钮或者添加链接前想一想?放过自己,也放过地球吧。
参考资料
[1] 数据囤积如何成为隐私和气候变化的新威胁丨小线菌
[2] 云计算减排将超新能源汽车丨IDC
[3] 全国数据中心能耗达两个三峡电站丨每日经济新闻
[4] 数据中心,从“电老虎”走向“数字经济发动机”丨国家发改委
[5] 绿色计算+数字减碳,阿里云的目标是“零碳云” 丨中国经济导报
评论20