Episodio 76
La inteligencia artificial de código abierto Qentres TTS está revolucionando la síntesis de voz, permitiendo clonar voces en solo tres segundos y generar audio hiperrealista en varios idiomas. Con una latencia de respuesta de apenas 97 milisegundos, este modelo de síntesis de voz de Alibaba desafía los límites físicos en este campo. En este episodio, se explora el análisis técnico detrás de esta tecnología y su impacto potencial en la industria y la sociedad.