NovosistemadoGooglegeravozindistinguíveldahumana

O Google anunciou seu novo sistema Tacotron 2, que traduz texto em fala e reivindica precisão quase humana ao imitar o áudio de uma pessoa. O sistema é a segunda geração da tecnologia, que consiste em duas redes neurais profundas. A primeira traduz o texto em um espectrograma (pdf), uma maneira visual de representar frequências de áudio ao longo do tempo. Esse espectrograma é então alimentado no WaveNet, um sistema do laboratório de pesquisa de inteligência artificial (IA) da Alphabet, DeepMind, que lê o gráfico e gera os elementos de áudio correspondentes em conformidade. (Confira em https://google.github.io/tacotron/publications/tacotron2/index.html.) Essa tecnologia é imediatamente útil para o Google. O WaveNet, anunciado pela primeira vez em 2016, já é usado para gerar voz no Google Assistant. Quando pronto, o Tacotron 2 poderia ser uma adição ainda mais poderosa ao serviço. Por enquanto, o sistema só é treinado para imitar uma única voz feminina. Fonte: Quartz

Eventos

26 Abr, 18
Veja todos os cases