 |
Цитата: |
 |
|
|
|
|
|
|
у файлов разная продолжительность из-за музыки, но текст произносится один и тот же. Они ведь в игре друг на друга наложатся, а нейросеть каждый файл, не буква в букву озвучивает.
|
|
 |
|
 |
|
А они точно наложатся друг на друга? Если есть речь без музыки, значит где-то должна быть и музыка без речи. Если есть файл - "
речь+музыка", то, вероятнее всего, он и используется. Можешь попробовать заменить сначала файл с речью и посмотреть, что изменилось в игре. Если они реально друг на друга накладываются, то должны звучать
Русская речь+Английская речь+музыка. Если используется второй файл с "
речь+музыка", то должно ничего не измениться и речь останется английской.
А чтобы было буква в букву, есть другая нейросеть, например,
vocalremover, чтобы выкинуть речь из музыки в случае, если они сведены в один файл. Потом кидаешь в нейросеть чистую речь и накладываешь результат на музыку в аудиоредакторе. В итоге получается два файла: "
Русская речь+музыка" и просто "
Русская речь".