Esta inteligencia artificial aprende más cuando recibe una 'recompensa'

El modelo chino de inteligencia artificial DeepSeek-R1 aprende más y mejor cuando recibe 'recompensas' por resolver problemas, pero esos estímulos requieren de la intervención humana, por lo que ese enfoque puede resultar costoso y limitar...



