Nie wiem czy to wam pomoże ale możecie spróbować użyć Google labs flown. Tam przy kreowaniu video jest taka opcja ,,składniki na film'' i odpowiednio robiąc screeny, a następnie używając tych screenów jako składników do filmu można uzyskać ogromną spójność tego co chce się wykreować, bardzo duże consistent character. Do tego od razu jest głos i dzwięk, jako chodzi o to co postać ma mówić to wystarczy, że w prompcie wpiszcie ,,Nazwa postaci says: Wypowiadany tekst'' i mówi co to do słowa to co w prompcie.
Do tego można przetestować za darmo, całkiem sporo da się tam zrobić bez wydawanie kasy. Zdecydowanie najlepsze narzędzie do tworzenia video jakie znam.