В отчете представлены результаты тематического исследования распространенности использования больших языковых моделей работниками.

Основное содержание:
- Работники широко используют большие языковые модели в задачах обобщения текста, что вызывает серьезные опасения по поводу постепенного ослабления “человеческого фактора” в текстовых данных, полученных из краудсорсинга.
- Широко распространено опасение, что LLM будут формировать нашу информационную экосистему, т.е. что большая часть информации, доступной онлайн, будет создана ИИ. Это может ухудшить производительность “рекурсивных” моделей, то есть тех, кто обучается на синтетически сгенерированных данных, и усилить влияние ценностей и идеологий, закодированных в этих моделях.
- Мы не верим, что это будет означать конец работы с толпой, но это может привести к радикальному изменению ценности, предоставляемой работниками. Вместо того чтобы предоставлять аннотации de novo, краудфандеры могут вместо этого служить важным человеческим фильтром для определения того, когда эти модели успешны, а когда нет. Ранние работы уже привели к значительному прогрессу в этом направлении, объединив человеческие и языковые модели для создания высококачественных и разнообразных данных.