2023年《数据+人工智能状况报告》研究了全球9,000多个Databricks客户在数据和人工智能应用方面的趋势。
2023 State of Data + AI涵盖更广泛的数据领域,以回答以下问题:
组织如何 在现实世界中应用数据科学和机器学习 (ML)?
哪些数据和AI产品目前最火爆,哪些正在迅速崛起?
组织如何执行他们的数据仓库,尤其是在这个人工智能的新时代?
1,数据科学与机器学习:NLP和LLMS需求量大
• 自2022年11月底至2023年5月初,使用SaaS LLM API的公司数量增长了1310%,这些API被用于访问像ChatGPT这样的服务。
• NLP占据了每日Python数据科学库使用量的49%,使其成为最流行的应用程序。
• 组织正在将更多的模型投入生产(YoY增长率为411%),同时也增加了他们的机器学习实验(YoY增长率为54%)。
• 组织正变得更加高效的使用机器学习;在三个实验模型中,大约有一个被投入生产,而在一年前,则为五个实验模型中的一个。
2,最佳
• Microsoft Power BI是2023年最受欢迎的数据和AI产品,
• 数据和AI产品中增长最快的是dbt,按客户数量增长206% YoY。
• 前10名数据和AI产品中有8个基于开放源代码。
• 数据集成是在Databricks Lakehouse上增长最快的数据和AI市场,YoY增长率为117%。
3,采用和迁移趋势
• 61%的客户从本地和云数据仓库迁移到Lakehouse。
• Delta Lake中的数据量年增长率为304%。
• Lakehouse越来越多地被用于数据仓库,包括使用Databricks SQL进行无服务器数据仓库,年增长率达144%。
来源:https://mp.weixin.qq.com/s/pnBgLbQLAv791-3geqk7vg
本文地址:https://www.163264.com/3499