IDC于近日发布了《Worldwide IDC Global DataSphere Forecast, 2024–2028: AI Everywhere, But Upsurge in Data Will Take Time》(Doc# US52076424.2024年5月)报告,对全球数据圈进行了未来五年预测,用于衡量每年创建、捕获、复制和消耗的数据量,包括消费者/企业、区域、数据类型、位置(核心、边缘、端侧)和云/非云。
IDC预测,全球2024年将生成159.2ZB数据,2028年将增加一倍以上,达到384.6ZB,复合增长率为24.4%。
长期以来,人工智能的影响力在各个领域和技术中都很明显,包括智能监控、智能助理以及AI支持的商业工具和工业自动化等等,这些因素共同推动了生成和存储的数据量的稳步增长。自2023年以来,不断出现的生成式AI平台和模型,加速了文本、图像、视频和其他数据类型等数字内容的创建,但由于最常见的GenAI应用产生的输出本质上尺寸较小,所以这些文件的生成尚未显著增加整体数据量。但毫无疑问,生成式AI对于数据量的增长是长期且持续的。
除生成式AI对数据量的影响外,DataSphere 2024最新预测还呈现了3D特征:
分布式(Distributed):到2024年,数据创建和复制的增长主要由超过632亿台能够生成数据的设备驱动,例如物联网设备、传感器。到2028年,预计所有数据的27%将在边缘产生,比2023年的19%显著增加。此外,企业还面临着管理跨混合和多云环境的数据的挑战,复制原始数据或副本有助于进一步分发。因此,来自生产中和IoT应用程序的数据以及企业创建的非娱乐图像数据通常会被复制8次以上,但并不会被长期保留;
多样化(Diverse):数据产生来源包括PC、服务器、智能手机等传统IT系统,到电视、平板电脑和游戏机等消费电子产品,再延伸到摄像机和传感器等物联网设备,产生了多样的数据。
动态(Dynamic):根据IDC跟踪数据,每年产生的数据中只有不到2%是长期存储的,但绝大多数数据仅短暂存在,只是即时使用或分析,例如流媒体视频或音乐。这种转瞬即逝的性质强调了数据的动态质量以及数据如何不断创建、利用然后丢弃,反映了数字交互和交易的快速发展。
预计到2028年,整个IDC全球数据圈的企业份额将扩大到80.5%,即309.7ZB,增长速度也比消费者数据快3倍以上,这其中驱动因素包括:
-不断增长的物联网设备安装,边缘和端侧的扩展;
-云计算和多云环境的广泛采用,支持可扩展的数据管理和分析功能;
-企业越来越多地采用人工智能和机器学习,从数据中获取新的见解;
-制造业和其他行业持续向自动化和数字化转型转变,其中涉及使用大量运营和性能数据;
-数字孪生的不断进步,包括制造、汽车、航空航天、医疗保健、公共事业等。
随着越来越多的数据被集中分析和复制,其中大部分数据将进入云端,云数据中心在密集型计算方面具有处理能力优势,这将推动云上生成的数据复合增长率达到40.3%,到2028年,约37%的数据将在云端生成,高于2023年的20.5%和2018年的12.2%。
IDC给技术供应商的建议:
-提前规划Gen AI将在组织中发挥的重大作用
-不要让消费者落后
-支持组织和消费者建立对数据的信任
-简化数据管理,提升企业智能水平
网友评论