Dobre bo po polsku:

zbigniew_latka_ia_praca_inzynierska.pdf

TTS_by_Google.pdf

I magisterka z implementacją tego, opisane szerzej i przystępniej:

Master_thesis-Automatic_Multispeaker_Voice_Cloning.pdf

i repo z kodem do niej:

CorentinJ - Overview

DeepVoice.pdf

WaveNet.pdf

tu_użyli_GAN.pdf

A tu konwersja głosu:

Automatyczna_konwersja_postrzeganej_tożsamości_głosu.pdf