Ru En

2023 Состояние данных и ИИ в 2023 году/2023 State of Data + AI, databricks

2023 State of Data + AI

2023
английский
databricks
Скачать документ

В этом отчете мы исследуем закономерности и тенденции внедрения данных и искусственного интеллекта среди более чем 9000 клиентов Databricks по всему миру. Databricks Lakehouse предоставляет возможность ознакомиться с состоянием данных и искусственного интеллекта, в том числе с тем, какие продукты и технологии являются наиболее популярными и быстрорастущими, какие типы разрабатываемых приложений для обработки данных и машинного обучения (DS/ML) и многое другое.

2023 Состояние данных и ИИ в 2023 году/2023 State of Data + AI, databricks
Основное содержание:

Наука о данных и машинное обучение: тренды
  • Число компаний, использующих SaaS LLM API (используемые для доступа к таким сервисам, как ChatGPT), выросло на 1310% в период с конца ноября 2022 года по начало мая 2023 года.
  • На долю NLP приходится 49% ежедневного использования библиотеки Python data science, что делает ее самым популярным приложением.
  • Организации запускают в производство значительно больше моделей (рост на 411% в годовом исчислении), а также расширяют свои эксперименты с ML (рост на 54% в годовом исчислении).
  • Организации становятся более эффективными с помощью ML; на каждые три экспериментальные модели примерно одна запускается в производство, по сравнению с пятью экспериментальными моделями годом ранее.
Ведущие ИИ-продукты на рынке:
  • Microsoft Power BI - самый популярный продукт для обработки данных и искусственного интеллекта 2023 года, превосходящий Databricks Lakehouse.
  • Самым быстрорастущим продуктом является dbt, количество клиентов которого выросло на 206% в годовом исчислении.
  • 8 из 10 лучших продуктов для обработки данных и искусственного интеллекта основаны на открытом исходном коде.
  • Интеграция данных - самый быстрорастущий рынок данных и искусственного интеллекта в Databricks Lake house с ростом на 117% в годовом исчислении.

Тренды внедрения:
  • 61% клиентов, переходящих в Lakehouse, приходят из локальных и облачных хранилищ данных.
  • Объем данных в Delta Lake вырос на 304% в годовом исчислении.
  • The Lakehouse все чаще используется для хранения данных, включая бессерверное хранилище данных с использованием Databricks SQL, объем которого вырос на 144% в годовом исчислении.

Документы