ИИ-компании начали скупать рабочие переписки и архивы данных закрывающихся компаний для обучения моделей

Владельцы получают возможность заработать на закрытии бизнеса, но эксперты предупреждают о рисках для приватности сотрудников.

Фото Reuters
Фото Reuters
  • О возникновении «нового рынка» вокруг корпоративных данных компаний пишет американский Forbes.
  • Основательница сервиса для создания субтитров cielo24 Шанна Джонсон рассказала изданию, что при ликвидации бизнеса смогла заработать «сотни тысяч долларов» на продаже данных, которые накопили в компании за 13 лет. Это в том числе переписки сотрудников в Slack, архивы электронных писем и задач в Jira, терабайты документов и файлов из Google Drive.
  • С продажей предпринимательнице помогал стартап SimpleClosure. По словам его главы Дори Йона, спрос на данные закрывающихся компаний постоянно растёт: разработчики ИИ «одержимы» поиском новых данных для обучения моделей.
  • Интернет как источник данных исчерпан и плохо подходит для обучения «агентных» систем, которые должны работать как виртуальные сотрудники, отмечают опрошенные Forbes эксперты. Данные реальных сотрудников со связями между задачами и даже ошибками помогают обучать агентов и тестировать их в приближённых к офису условиях.

  • Чтобы удовлетворить спрос, SimpleClosure запустила платформу Asset Hub, через которую ликвидирующиеся компании могут продавать свои данные. За последний год через неё провели около 100 сделок на общую сумму более $1 млн. Размер чека за набор данных в среднем составляет от $10 тысяч до $100 тысяч.
  • У SimpleClosure также есть конкурент — компания Sunset. Она покупает данные ликвидирующихся компаний и затем продаёт их разработчикам ИИ. По словам её руководителя Брендана Махона, цена может зависеть от возраста компании, объёма данных и их «насыщенности». Например, задача в Jira, привязанная к конкретному фрагменту кода, представляет большую ценность, чем разрозненная информация. Дороже всего продаются данные компаний из сфер здравоохранения и финансов, отметил он.
  • При этом некоторые эксперты указывают на риски для конфиденциальности сотрудников, которые не предполагали, что их сообщения и результаты работы будут продавать третьим лицам. В SimpleClosure утверждают, что анонимизируют все продаваемые данные, но специалисты говорят, что эффективного решения этой проблемы пока нет.

5
3
2
1
1
1
51 комментарий