Потестил новые скилы 2.0 в клауде код
Главная фича → евал, и мы её все поняли неправильно скорее всего.
Она не запускает скил множественными прогонами на самом деле, а
dry-run — сабагенты читали SKILL.md и писали транскрипт "что бы я сделал", не выполняя ни одной команды
▸ Почему это не тестирование
Что может быть полезно, но никак не тестирование скилов, как многие пишут или снимают на ютубе.
Полезной работы не выполняется, я это понял когда начал евалить и бенчить один своих скилов на работу в браузере, а браузер не открывался.
Соответственно и многие советы, которые выдаются в бенчах и евалах — неприменимы и вредны, часто противоречат задумке.
Источник: Telegram-канал Аи Помогатор
Начать дискуссию