Josef Chen dice que comprimió toda la cocina humana en dos megabytes. Esa es una afirmación audaz. También lo comprueba.
Chen, cofundador y director ejecutivo de la startup londinense de IA alimentaria KAIKAKU.AI, publicó un artículo en arXiv esta semana, junto con el investigador Jakub Radzikowski, presentando Epicure: tres modelos de IA entrenados en 4,14 millones de recetas extraídas de 11 conjuntos de datos en siete idiomas. El resultado: un mapa de 1.790 ingredientes, cada uno descrito por 300 números, que cabe en el límite de archivos adjuntos de su correo electrónico con espacio de sobra.
“4,1 millones de recetas. 7 idiomas. 1.790 ingredientes. 300 dimensiones”, escribió Chen en X. “Toda la cocina humana comprimida en 2 megabytes”.
Lanzamos nuestro nuevo artículo sobre arXiv: entrenamos el modelo alimentario multilingüe más grande jamás construido.
4,1 millones de recetas. 7 idiomas. 1.790 ingredientes. 300 dimensiones.
Toda la cocina humana comprimida en 2 megabytes. pic.twitter.com/b4GiZ62UMt
– Josef Chen (@josefchen) 26 de mayo de 2026
No almacena recetas.
Antes de imaginar una memoria USB de dos megabytes repleta de instrucciones para saltear, el modelo no almacena ni una sola receta. Los dos megas son más una tabla de coordenadas que un libro de cocina.
Anuncio
Anuncio
Piense en ello como un mapa. Cada ingrediente obtiene una ubicación precisa en función de cómo se comporta en millones de platos reales en todo el mundo. Las matemáticas son contundentes: 1.790 ingredientes – 300 números por ingrediente – 4 bytes cada uno – 2,05 megabytes. Esos números codifican qué ingredientes aparecen juntos, cuáles comparten compuestos de sabor y cuáles pertenecen a la misma tradición culinaria. Una vez que el modelo aprende todo eso de las recetas, las recetas pueden desaparecer. El conocimiento vive en las coordenadas.
Este es esencialmente el mismo truco que word2vec utilizó en el lenguaje en 2013, cuando los investigadores de Google demostraron que se podía hacer aritmética con significado. Epicure hace eso con la comida. Tome carne de res, apunte hacia Estados Unidos y obtendrá pan, lechuga y tal vez cerveza. Apunte hacia el Sudeste Asiático y el modelo deja de pensar en hamburguesas y parrilladas y empieza a pensar en salsa de soja, jengibre y aceite de sésamo.
Esto sucede a través de lo que el artículo describe como un operador de dirección llamado rotación SLERP. Tome un ingrediente semilla (pollo) y gírelo matemáticamente hacia una dirección de cocina. A los 30 grados empiezas a ver territorio Tex-Mex. A 60 grados, el pollo y la carne convergen en la misma despensa mexicana: tortilla de maíz, salsa, monterey jack, chile poblano. El ángulo es un dial entre “permanecer cerca de este ingrediente” y “aterrizar en algún lugar nuevo”.
Epicure viene en tres versiones y elegir la correcta depende de lo que realmente estés preguntando. Cooc aprende de la coexistencia de recetas (lo que aparece juntos en platos reales) y Chem aprende de la química del sabor (qué ingredientes comparten compuestos aromáticos de la base de datos químicos de FlavorDB). Core es una mezcla entre los dos anteriores.
Anuncio
Anuncio
Pregúntele a Cooc qué combina con el chocolate y es posible que encuentre acompañantes en la despensa de postres: cacao en polvo, vainilla y almendras. Pregúntele a Chem y obtendrá iguales en química de sabores: caramelo, dulce de azúcar, ganache.
Mismo ingrediente, pregunta diferente. Un chef que busca un sustituto tiene necesidades diferentes a las de un chef que busca compatibilidad de sabores.
Por qué esto no es ChatGPT para comida
Epicure no tiene conocimientos generales, ni generación de lenguaje, ni capacidad para alucinar un ingrediente que nunca ha visto. Conoce 1.790 ingredientes. Ese es el mundo entero, en lo que a este modelo se refiere. Lo que renuncia en amplitud lo gana en confiabilidad, a diferencia de los chatbots de recetas que sugerirán con seguridad veneno como ingrediente para cocinar si los presiona en el sentido equivocado.
El estado del arte anterior aquí era FlavorGraph, un modelo de 2021 que combinaba datos químicos con el conjunto de datos Recipe1M+ solo en inglés. Epicure incorpora un corpus multilingüe más de cuatro veces mayor y limpia el vocabulario para lograr eficiencia.
Anuncio
Anuncio
Los usos prácticos no son difíciles de imaginar. Un chef pregunta cómo es el equivalente asiático del este de un ingrediente mediterráneo. Un desarrollador de productos alimenticios pregunta qué canje mínimamente procesado cae en la misma zona de sabor que un aditivo. Una aplicación de recetas necesita una sustitución coherente cuando falta un ingrediente en la despensa. Esta última es la brecha en la que los modelos pequeños especialmente diseñados superan silenciosamente a los grandes generalistas.
El artículo de Epicure es un comunicado de investigación. Los modelos entrenados están en vivo en Hugging Face y hay un mapa interactivo de ingredientes accesible públicamente en epicure.kaikaku.ai. Incluso lanzaron un MCP para sus agentes. El código de capacitación completo no se publica en este momento.






