Потестил новые скилы 2.0 в клауде код

Главная фича → евал, и мы её все поняли неправильно скорее всего.

Она не запускает скил множественными прогонами на самом деле, а

dry-run — сабагенты читали SKILL.md и писали транскрипт "что бы я сделал", не выполняя ни одной команды

▸ Почему это не тестирование

Что может быть полезно, но никак не тестирование скилов, как многие пишут или снимают на ютубе.

Полезной работы не выполняется, я это понял когда начал евалить и бенчить один своих скилов на работу в браузере, а браузер не открывался.

Соответственно и многие советы, которые выдаются в бенчах и евалах — неприменимы и вредны, часто противоречат задумке.

Начать дискуссию