INTELIGÊNCIA ARTIFICIAL (IA) – ANÁLISE E GERAÇÃO DE SONS (WAVENET)

INTELIGÊNCIA ARTIFICIAL (IA) – ANÁLISE E GERAÇÃO DE SONS (WAVENET)

A formação Inteligência Artificial (IA) – Análise e Geração de Sons destina‑se a desenvolvedores, data scientists e gestores de projeto que pretendem compreender as possibilidades da IA no tratamento, análise e geração de sons. Ao longo da formação, os participantes exploram conceitos de processamento de sinal digital, aplicações de IA à voz, música e ruído, técnicas de reconhecimento e síntese vocal, deteção e separação de fontes sonoras, bem como IA generativa aplicada ao áudio. A formação aborda ainda ferramentas e plataformas de referência (WaveNet, Amazon Transcribe, IBM Watson, MusicLM, Mubert, entre outras), incluindo questões éticas e jurídicas associadas à clonagem de voz e aos direitos de autor.

  • Reconhecer os princípios de funcionamento e saber quais são as ferramentas existentes para o tratamento ou a geração de sons.
2 dias

Introdução

• Definição de um som
• Bases do tratamento de sinal digital
• Diferentes tipos de som
• Tecnologias utilizadas

Intervenção da IA nas diferentes etapas do processo de tratamento do som

• Aplicações
• Música
• Ruídos (industriais, de ambiente)
• Tratamento do sinal
• Machine Learning
• Deep Learning (redes neuronais)
• Gravação
• Triagem de gravações
• Análise
• Geração

Tratamento da voz

• Reconhecimento vocal
• Compreensão e análise de discurso ou de comandos vocais
• Traduções
• Retranscrições
• Domínio médico

Análise de músicas

• Classificação
• Reconhecimento de estilo
• Reconhecimento de compositores

Deteção de ruídos

• Segurança
• Supressão de ruídos (melhoria de produções musicais)
• Análise e separação de fontes sonoras

Geração de música

• Síntese vocal

Ferramentas

• MetaVoice: modificação da voz
• ht: transformação de texto em áudio
• Separação de pistas áudio: AudioStrip
• Síntese vocal: WaveNet
• Áudio e vídeo: Sonix, NVIDIA Jarvi, IBM Watson
• Tratamento de gravações áudio: Amazon Transcribe (retranscrição em texto, análise de conteúdo, estatísticas de palavras-chave, reconhecimento de interlocutor)
• Retranscrição de discurso em tempo real com Amazon Transcribe

Exemplos de exercícios práticos

• Demonstração de “Text to Speech” da IBM Watson

IA generativas

• Princípio de funcionamento
• GAN (Generative Adversarial Network)

Exemplos

• Google MusicLM: MusicLM
• Boomy
• Mubert
• Soundraw
• Beatoven

Geração de música a partir de uma descrição em texto

• Mubert

Exemplos de exercícios práticos

• Criação de faixas de música com Mubert

Evoluções

• Limites
• Geração de música livre de direitos
• Descrição em texto
• Escolha do estilo

Problemas éticos

• Desvio de voz
• Clonagem de voz

Fontes

• Dados utilizados na aprendizagem

Aspetos jurídicos

• Direitos de autor
• Ligações com a indústria musical

Nota: O conteúdo deste programa pode ser objeto de adaptação em função dos níveis, pré-requisitos e necessidades dos participantes.

Facilitador que combina know-how com experiência empresarial e competências pedagógicas, para dar resposta a necessidades operacionais e potenciar a aprendizagem.

Objetivos da formação

  • Reconhecer os princípios de funcionamento e saber quais são as ferramentas existentes para o tratamento ou a geração de sons.

Duração da formação

2 dias

Programa da formação

Introdução

• Definição de um som
• Bases do tratamento de sinal digital
• Diferentes tipos de som
• Tecnologias utilizadas

Intervenção da IA nas diferentes etapas do processo de tratamento do som

• Aplicações
• Música
• Ruídos (industriais, de ambiente)
• Tratamento do sinal
• Machine Learning
• Deep Learning (redes neuronais)
• Gravação
• Triagem de gravações
• Análise
• Geração

Tratamento da voz

• Reconhecimento vocal
• Compreensão e análise de discurso ou de comandos vocais
• Traduções
• Retranscrições
• Domínio médico

Análise de músicas

• Classificação
• Reconhecimento de estilo
• Reconhecimento de compositores

Deteção de ruídos

• Segurança
• Supressão de ruídos (melhoria de produções musicais)
• Análise e separação de fontes sonoras

Geração de música

• Síntese vocal

Ferramentas

• MetaVoice: modificação da voz
• ht: transformação de texto em áudio
• Separação de pistas áudio: AudioStrip
• Síntese vocal: WaveNet
• Áudio e vídeo: Sonix, NVIDIA Jarvi, IBM Watson
• Tratamento de gravações áudio: Amazon Transcribe (retranscrição em texto, análise de conteúdo, estatísticas de palavras-chave, reconhecimento de interlocutor)
• Retranscrição de discurso em tempo real com Amazon Transcribe

Exemplos de exercícios práticos

• Demonstração de “Text to Speech” da IBM Watson

IA generativas

• Princípio de funcionamento
• GAN (Generative Adversarial Network)

Exemplos

• Google MusicLM: MusicLM
• Boomy
• Mubert
• Soundraw
• Beatoven

Geração de música a partir de uma descrição em texto

• Mubert

Exemplos de exercícios práticos

• Criação de faixas de música com Mubert

Evoluções

• Limites
• Geração de música livre de direitos
• Descrição em texto
• Escolha do estilo

Problemas éticos

• Desvio de voz
• Clonagem de voz

Fontes

• Dados utilizados na aprendizagem

Aspetos jurídicos

• Direitos de autor
• Ligações com a indústria musical

Nota: O conteúdo deste programa pode ser objeto de adaptação em função dos níveis, pré-requisitos e necessidades dos participantes.

Formador

Facilitador que combina know-how com experiência empresarial e competências pedagógicas, para dar resposta a necessidades operacionais e potenciar a aprendizagem.

Indisponível

Quer uma formação à medida para a sua empresa?

Peça-nos uma proposta!
Clique na imagem para expandir

Os nossos espaços de formação oferecem todas as condições para continuar o seu desenvolvimento pessoal e profissional em absoluta segurança

Não se esqueça de subscrever o blog RhBizz e de nos seguir no LindekInFacebookInstagram Youtube.

Formações ajustadas ao seu negócio

FORMAÇÕES À MEDIDA

Provocamos e aceleramos processos de mudança com a implementação e desenvolvimento de soluções pragmáticas orientadas para os resultados

SABER MAIS