Ви не увійшли.
Приходилось тренировать нейронную сеть с использованием аудиофайлов.
У меня есть набор аудиоданных, содержащий папки с именем человека и командами. Предположим, что одна папка - «Марвин», имя человека становится «Мавин», а другая папка «говорит», поэтому команда - «говорить». Теперь мне нужны аудиофайлы, в которых говорится: «Марвин говорит».
Прямо сейчас подход, который я думал, заключался в объединении аудиофайлов в библиотеке pydub и обучении нейронной сети.
from pydub import AudioSegment
sound_marvin = AudioSegment.from_file('marvin_audio.wav')
sound_speak = AudioSegment.from_file('speak_audio.wav')
final = sound_marvin + sound_speak
final.export('final.wav', format='wav')
Правильно ли мой подход или есть способ лучше?
Любые предложения / идеи приветствуются.
_________________________________
Тренер для ML online course.
Неактивний