Ponytail para Claude Code: ¿ahorra tokens de verdad?

Una skill de código abierto que reduce tu gasto en Claude Code un 75%. Que el modelo escriba un 90% menos de código. Que trabaje entre 3 y 6 veces más rápido. Si has visto el reel de Chase AI que ha puesto a Ponytail en el mapa como la skill más comentada para Claude Code, probablemente ya estés pensando en instalarlo. Y mira, la idea de fondo no es mala. Pero las cifras huelen a catálogo de teletienda.

Benchmarks independientes confirman el ahorro: Tests de Chase AI muestran que Ponytail reduce código un 71%, coste un 53% y es 71% más rápido. Con Opus. Con Haiku los números son más modestos (~56%/25%/30%).
Los modelos potentes se benefician más: Opus es más verboso, así que Ponytail tiene más que recortar. Las cifras originales del README, medidas con Haiku, infravaloraban el efecto real.
No sustituye la disciplina: Prompts precisos, modelo adecuado por tarea y reutilización de contexto siguen siendo la base. Ponytail recorta la verbosidad del modelo, no la pereza del usuario.

Veredicto: Ponytail cumple más de lo que anuncia con Opus. Combínalo con buenas prácticas y el ahorro se nota.

Actualización (23 junio 2026): Añadida sección con benchmarks independientes que validan y amplían las cifras originales.

Qué es Ponytail y cómo funciona en Claude Code

Diagrama: Comparación entre el flujo normal de Claude Code (verboso y costoso) y el flujo optimizado con plan

Ponytail es un repositorio de código abierto que ha acumulado unas 15.000 estrellas en GitHub en tiempo récord. Su mecanismo es sencillo: una skill que se instala en Claude Code e impone un enfoque deliberadamente «perezoso». Antes de generar código, el agente planifica y busca la solución con el menor número de líneas posible.

La difusión ha venido sobre todo de un reel viral de Chase AI en Instagram, con el tono inconfundible del «truco que lo cambia todo». Las cifras que circulan: reducción de código del 80-94%, ahorro de costes del 47-77%, velocidad multiplicada entre 3x y 6x. Números que suenan a magia. Y ahí es donde conviene encender las luces largas.

Premisa sólida, cifras de catálogo: el problema real de Ponytail

Antes de desmontar nada, lo justo: la idea base es correcta. Los modelos de lenguaje son verbosos por naturaleza. Les pides que arreglen un bug y te reescriben medio archivo. Les pides una función y te devuelven la función, los tests, los comentarios, un refactor del módulo vecino y una nota pidiendo disculpas por la molestia.

Esa verbosidad tiene un coste real. Con Opus, cada token de salida sale caro. Con Claude Fable en el horizonte, la cosa se pone peor. Si tus sesiones son largas y tocas muchos archivos, la factura crece rápido.

Pero un 75% de ahorro en tokens, un 90% menos de código, 3-6x más rápido: ¿comparado con qué exactamente? No hay un benchmark detrás de esas cifras. Nadie ha publicado una comparativa controlada que diga «con esta tarea concreta, sin Ponytail se generaron X tokens y con Ponytail se generaron Y». Son números de marketing. Buenos para un reel, insuficientes para tomar una decisión técnica.

Las 15.000 estrellas en GitHub tampoco significan lo que parece. Las estrellas miden viralidad, no eficacia. Y cuando envuelves una buena idea en cifras infladas, consigues justo lo contrario: que la gente que podría beneficiarse desconfíe de todo.

Cómo gastar menos en Claude Code sin instalar nada

Ponytail para Claude Code: ¿ahorra tokens de verdad?

La mayor parte del ahorro que Ponytail promete se consigue con disciplina de uso. Sin repositorios nuevos, sin skills adicionales:

Prompts concisos y específicos. En lugar de «arregla este componente», dile exactamente qué arreglar, en qué archivo y con qué restricciones. Cuanto más preciso el input, menos basura en el output.
Pedir explícitamente menos código. Un «solo modifica las líneas necesarias, no reescribas el archivo» en tu prompt cambia mucho lo que genera el modelo.
Elegir el modelo adecuado para cada tarea. No uses Opus para formatear un JSON. Sonnet o Haiku resuelven tareas mecánicas a una fracción del coste, tal y como refleja la documentación oficial de modelos de Claude. Reserva Opus para lo que de verdad necesita razonamiento complejo.
Reutilizar contexto. Si Claude Code re-lee todo tu repositorio en cada sesión, estás quemando tokens en contexto repetido. Skills como graphify generan un mapa del código que el modelo puede consultar sin re-escanear cada archivo.
Reducir la verbosidad del output. Skills como caveman fuerzan respuestas cortas y directas. Es básicamente lo que hace Ponytail, pero sin el envoltorio de marketing.

Ninguna de estas prácticas requiere instalar un repo nuevo. Y si te preocupa el coste de las sesiones largas, conviene estar al tanto de los movimientos recientes de Anthropic con los planes de Claude Code, que pueden cambiar lo que pagas de un día para otro.

Los benchmarks independientes que faltaban

Cuando publicamos este artículo, una de las críticas era que no existían benchmarks independientes. Chase AI ha corrido las mismas pruebas del repositorio tanto con Haiku 4.5 (el modelo original de Ponytail) como con Opus 4.8:

Métrica	Ponytail (publicado)	Haiku 4.5	Opus 4.8
Reducción de código	~54%	56%	71%
Ahorro en coste	~20%	25%	53%
Mejora en velocidad	~27%	30%	71%

Ponytail funciona mejor de lo que anuncia, pero solo con modelos potentes. Con Haiku los resultados confirman las cifras publicadas. Con Opus el salto es brutal: 71% menos código y 71% más rápido.

La explicación tiene sentido: los modelos más capaces son los más verbosos. Opus tiende a recrear desde cero funcionalidad que ya existe en librerías o en el propio proyecto. Ponytail frena exactamente eso: «si ya existe, úsalo». Cuanto más verboso es el modelo, más margen hay para recortar.

Las cifras de Ponytail no estaban infladas. Estaban subestimadas, medidas con un modelo que no era el que más se beneficia. Si usas Opus, el ahorro real supera lo que el README promete. Dicho esto: son benchmarks de un solo evaluador con metodología limitada. Lo inteligente sigue siendo combinar la skill con las prácticas que describimos arriba.

¿Vale la pena instalar Ponytail en Claude Code?

Sí. Con los benchmarks independientes encima de la mesa, Ponytail no es solo una idea bonita: los números respaldan la herramienta, especialmente si trabajas con Opus. Que sigue siendo donde el ahorro importa de verdad, porque es donde los tokens cuestan más.

Dicho esto, ninguna skill sustituye la disciplina. Ponytail recorta la verbosidad del modelo, pero el ahorro de fondo sale de asumir que cada token cuesta dinero y actuar en consecuencia: prompts precisos, modelo adecuado para cada tarea, contexto reutilizado. Si combinas eso con Ponytail, sí se nota en la factura.

Pruébalo si quieres. Ignora el bombo. Y si alguien te vende un truco que lo cambia todo, acuérdate de que en este sector los trucos que lo cambian todo duran lo que tarda el siguiente reel en hacerse viral.

▶ ¿Quieres probarlo tú mismo?

Copia esto y pégalo en Claude Code, Cursor o tu asistente de código favorito:

Instala la skill Ponytail desde https://github.com/DietrichGebert/ponytail siguiendo las instrucciones del README. Configúrala en mi proyecto actual y haz una prueba: refactoriza el archivo más largo del proyecto usando el enfoque lazy de Ponytail. Compara el número de líneas antes y después.

No necesitas saber programar. El asistente se encarga de la instalación, la configuración y las pruebas.

Qué es Ponytail y cómo funciona en Claude Code

Premisa sólida, cifras de catálogo: el problema real de Ponytail

Cómo gastar menos en Claude Code sin instalar nada

Los benchmarks independientes que faltaban

¿Vale la pena instalar Ponytail en Claude Code?

Related Posts