A narração por voz pode separar os fluxos de tempo de vídeo e áudio, permitindo que o narrador descreva o que está acontecendo no vídeo enquanto o vídeo em si não está sendo reproduzido. Isso pode ser feito iniciando a narração antes do início do vídeo, continuando a narração enquanto o vídeo está sendo reproduzido e encerrando a narração após o término do vídeo. Isso permite que o espectador ouça o que está acontecendo no vídeo sem precisar assisti-lo, ou assista ao vídeo sem precisar ouvir a narração.