2023 年十大战略技术趋势中哪一项最需要 HTAP ?

前几天,Gartner 发布了企业机构在2023年需要探索的十大战略技术趋势。

Gartner 杰出研究副总裁 Frances Karamouzis 表示:“为了在经济动荡时期增加企业机构的盈利,首席信息官和IT高管必须在继续加快数字化转型的同时,将目光从节约成本转向新的卓越运营方式。Gartner 2023年战略技术趋势围绕优化、扩展和开拓这三大主题,这些技术能够帮助企业机构优化韧性、运营或可信度、扩展垂直解决方案和产品交付并利用新的互动形式、更加快速地响应或机会进行开拓。”

Gartner 提出的 2023 年十大战略技术趋势按照顺序分别是:

  1. 可持续性(Sustainability)
  2. 元宇宙(Metaverse)
  3. 超级应用(Superapps)
  4. 自适应AI(Adaptive AI)
  5. 数字免疫系统(Digital Immune System)
  6. 应用可观测性(Applied Observability )
  7. AI信任、风险和安全管理(Trust, Risk and Security Management)
  8. 行业云平台(Industry Cloud Platforms)
  9. 平台工程(Platform Engineering)
  10. 无线价值实现(Wireless Value Realization)

那么这十大技术中哪一项最适合使用HTAP呢?

不卖关子了,答案就是自适应 AI(Adaptive AI)

**自适应 AI **本意是传统的 AI 系统需要面对不断变化的环境,具体要求为:一是模型训练好以后,由于外部环境不断改变,模型是否可以继续应用到不断变化的环境中;二是模型训练好以后,需要添加更多的训练数据迭代模型;三是希望模型最后在推理的时候产生一些个性化的结果,而非一般化的结果。这三个新的要求实际上对 AI 模型来说是希望模型训练和推理逐渐走向在线训练、在线推理。

"在线推理"比较好理解,各大短视频或者电商 APP 会结合用户兴趣持续推荐可能感兴趣的内容;"在线训练”是指背后的 AI 模型需要实时更新,只有实时更新才能更好响应进一步输入的工作,进而让训练和推理形成正向循环,这个叫作“自适应 AI”。

简单来说,自适应AI系统通过不断反复训练模型并在运行和开发环境中使用新的数据进行学习来迅速适应在最初开发过程中无法预见或获得的现实世界情况变化。这些系统根据实时反馈动态调整它们的学习和目标,因此适合外部环境快速变化的运营或者因为企业目标不断变化而需要优化响应速度的运营。

而在自适应AI的这个实时分析训练的过程中,不可避免地要用到一些数据,这些数据并不是越大越好的,正如 AI 和 ML 领域国际上最权威的学者之一吴恩达教授在今年年初接受 IEEE Spectrum 所说的:AI 的下一个发展方向,正在从“大”数据转向“小”数据

深度学习等方法通过“大”数据来训练模型学习特征,使用的数据和算力都太大。虽然目前通过使用预训练模型的方式在很大程度上解决了这个问题。但是依然不够。能否通过小数据也训练出很好的模型呢?解决的方法是让小数据成为优质数据。许多学习方法都是监督学习的方式,需要对训练数据的特征进行标注。如果能挑选出有效的数据,并且进行准确的标注,通过优质数据训练出来的模型也有很好的泛化能力。设计一个有效甄别优质数据并能一致性标注的系统,以数据为中心的训练,这也就是“以数据为中心”的 AI 的理念转变。

可以看到,这个解读与我们在《HTAP 的下一步,SoTP初探(上):从”大“数据到”小“而”宽“数据》这篇文章里提到的“小”数据与“宽”数据应用场景案例完全吻合。

当然,我们这里讲的自适应AI,是属于自适应自动系统的一部分,这个趋势无疑与StoneDB后续要重点投入的方向是强相关的,我们后续就会加强StoneDB的实时分析处理能力,还要加上 Autopilot 功能(这个功能本身就可以视作是自适应AI或者自适应ML的一种),StoneDB Autopilot 将在许多重要且具有挑战性的方面加入自动化处理能力,以实现大规模的高查询性能——包括配置、数据加载、查询执行和故障处理。它使用先进的技术对数据采样,收集数据和查询的统计信息,并构建机器学习模型,对内存使用、网络负载和执行时间进行建模。StoneDB Autopilot 使我们 Tianmu 引擎的查询优化器随着执行更多查询而变得越来越智能,从而随着时间的推移不断提高系统性能。

听起来是不是很酷?当然,自适应 AI 还有很多可以应用的场景,这是 Gartner 在提出生成式 AI 后又力推的一个主流技术趋势,仔细观察最近的 AI 技术市场,MLOps 和 AIOps 的热度都在不断上升,而要给这些核心技术加速的话,HTAP 是必不可少的,而在 HTAP 数据库中,特别针对“小”而“宽”数据的SoTP(Serving over TP)型数据库将迎来更多的挑战和机遇。

附:2023年重要战略技术趋势包括:

可持续性(Sustainability)

可持续性贯穿2023年的所有战略技术趋势。在 Gartner 最近的一项调查中,首席执行官们表示环境和社会变化已成为投资者的三大优先事项之一,仅次于利润和收入。这意味着为了实现可持续性目标,高管必须加大对满足ESG需求的创新解决方案的投资力度。为此,企业机构需要新的可持续技术框架来提高IT服务的能源和材料效率,通过可追溯性、分析、可再生能源和人工智能(AI)等技术实现企业的可持续发展,同时还要部署帮助客户实现其可持续性目标的IT解决方案。

开 拓

元宇宙(Metaverse)

Gartner将元宇宙定义为一个由通过虚拟技术增强的物理和数字现实融合而成的集体虚拟共享空间。这个空间具有持久性,能够提供增强沉浸式体验。Gartner预计完整的元宇宙将独立于设备并且不属于任何一家厂商。它将产生一个由数字货币和非同质化通证(NFT)推动的虚拟经济体系。Gartner预测,到2027年,全球超过40%的大型企业机构将在基于元宇宙的项目中使用Web3、增强现实(AR)云和数字孪生的组合来增加收入。

超级应用(Superapps)

超级应用是一个集应用、平台和生态系统功能于一身的应用程序。它不仅有自己的一套功能,而且还为第三方提供了一个开发和发布他们自己的微应用的平台。Gartner预测,到2027年,全球50%以上的人口将成为多个超级应用的日活跃用户。

Karamouzis表示:“虽然大多数超级应用是移动应用,但这个概念也可以应用于Microsoft Teams、Slack等桌面客户端应用,关键在于超级应用必须能够整合并取代客户或员工使用的多个应用。”

自适应AI(Adaptive AI)

自适应AI系统通过不断反复训练模型并在运行和开发环境中使用新的数据进行学习来迅速适应在最初开发过程中无法预见或获得的现实世界情况变化。这些系统根据实时反馈动态调整它们的学习和目标,因此适合外部环境快速变化的运营或者因为企业目标不断变化而需要优化响应速度的运营。

优 化

数字免疫系统(Digital Immune System)

76%负责数字产品的团队现在还需要对营收负责,因此首席信息官正在寻找新的实践和方法,使其团队能够在实现高商业价值的同时,降低风险和提高客户满意度。数字免疫系统为他们提供了满足这一要求的路线图。

数字免疫系统通过结合数据驱动的运营洞察、自动化和极限测试、自动化事件解决、IT运营中的软件工程以及应用供应链中的安全性来提高系统的弹性和稳定性。Gartner预测,到2025年,投资建设数字免疫系统的企业机构将能够减少多达80%的系统宕机时间,所减少的损失将直接转化为更高的收入。

应用可观测性(Applied Observability )

在任何相关方采取任何类型的行动时,都会产生包含了数字化特征的可观测数据,如日志、痕迹、API调用、停留时间、下载和文件传输等。应用可观测性以一种高度统筹和整合的方式将这些可观测的特征数据进行反馈,创造出一个决策循环,从而提高组织决策的有效性。

Karamouzis表示:“可观测行应用使企业机构能够利用他们的数据特征来获得竞争优势。它能够在正确的时间提高正确数据的战略重要性,以便根据确认的相关方行动而不是意图采取快速行动,因此是一种强大的工具。如果能够在战略中予以规划并成功执行,可观测性应用将成为数据驱动型决策的最强大来源。”

AI信任、风险和安全管理(Trust, Risk and Security Management)

许多企业机构未做好管理AI风险的充分准备。Gartner在美国、英国和德国开展的一项调查显示,41%的企业机构曾经历过AI隐私泄露或安全事件。但该调查也发现积极管理AI风险、隐私和安全的企业机构在AI项目中取得了更好的成果。与未积极管理这些功能的企业机构的AI项目相比,在这些企业机构中有更多的AI项目能够从概念验证阶段进入到生产阶段并实现更大的业务价值。

企业机构必须使用新的功能来保证模型的可靠性、可信度、安全性和数据保护。AI信任、风险和安全管理(TRiSM)需要来自不同业务部门的参与者共同实施新的措施。

扩 展

行业云平台(Industry Cloud Platforms)

行业云平台通过组合SaaS、平台即服务(PaaS)和基础设施即服务(IaaS)提供支持行业应用场景的行业模块化能力。企业可以将行业云平台的打包功能作为基础模块,组合成独特、差异化的数字业务项目,在提高敏捷性、推动创新和缩短产品上市时间的同时避免单一厂商锁定。

Gartner预测,到2027年,超过50%的企业将使用行业云平台来加速他们的业务项目。

平台工程(Platform Engineering)

平台工程是一套用来构建和运营支持软件交付和生命周期管理的自助式内部开发者平台的机制和架构。平台工程的目标是优化开发者体验并加快产品团队为客户创造价值的速度。

Gartner预测,到2026年,80%的软件工程组织将建立平台团队,其中75%将包含开发者自助服务门户。

无线价值实现(Wireless Value Realization)

由于没有一项技术能够占据主导地位,企业将使用一系列无线解决方案来满足办公室Wi-Fi、移动设备服务、低功耗服务以及无线电连接等所有场景的需求。Gartner预测,到2025年,60%的企业将同时使用五种以上的无线技术。

网络的功能将不再仅限于纯粹的连接,它们将使用内置的分析功能提供洞察,而其低功耗系统将直接从网络中获取能量。这意味着网络将直接产生商业价值。
StoneDB 2.0 云原生分布式实时 HTAP 架构详细设计以 RFC 形式持续进行,欢迎大家关注我们最新进展,更欢迎给我们开源协作的模式和方法提出改进意见,一起通过开源的方式共建 StoneDB ~

https://github.com/stoneatom/stonedb/issues/436

  • StoneDB 代码已完全在 Github 开源:

https://github.com/stoneatom/stonedb

  • StoneDB 官网:

https://stonedb.io/

热门相关:仙城纪   薄先生,情不由己   寂静王冠   第一神算:纨绔大小姐   人间欢喜