Dobre bo po polsku:
zbigniew_latka_ia_praca_inzynierska.pdf
TTS_by_Google.pdf
I magisterka z implementacją tego, opisane szerzej i przystępniej:
Master_thesis-Automatic_Multispeaker_Voice_Cloning.pdf
i repo z kodem do niej:
CorentinJ - Overview
DeepVoice.pdf
WaveNet.pdf
tu_użyli_GAN.pdf
A tu konwersja głosu:
Automatyczna_konwersja_postrzeganej_tożsamości_głosu.pdf