INTELIGÊNCIA ARTIFICIAL (IA) – ANÁLISE E GERAÇÃO DE SONS (WAVENET)
- inteligência artificial, Inteligência Artificial, New
- 0 (Registered)
A formação Inteligência Artificial (IA) – Análise e Geração de Sons destina‑se a desenvolvedores, data scientists e gestores de projeto que pretendem compreender as possibilidades da IA no tratamento, análise e geração de sons. Ao longo da formação, os participantes exploram conceitos de processamento de sinal digital, aplicações de IA à voz, música e ruído, técnicas de reconhecimento e síntese vocal, deteção e separação de fontes sonoras, bem como IA generativa aplicada ao áudio. A formação aborda ainda ferramentas e plataformas de referência (WaveNet, Amazon Transcribe, IBM Watson, MusicLM, Mubert, entre outras), incluindo questões éticas e jurídicas associadas à clonagem de voz e aos direitos de autor.
- Reconhecer os princípios de funcionamento e saber quais são as ferramentas existentes para o tratamento ou a geração de sons.
Introdução
• Definição de um som
• Bases do tratamento de sinal digital
• Diferentes tipos de som
• Tecnologias utilizadas
Intervenção da IA nas diferentes etapas do processo de tratamento do som
• Aplicações
• Música
• Ruídos (industriais, de ambiente)
• Tratamento do sinal
• Machine Learning
• Deep Learning (redes neuronais)
• Gravação
• Triagem de gravações
• Análise
• Geração
Tratamento da voz
• Reconhecimento vocal
• Compreensão e análise de discurso ou de comandos vocais
• Traduções
• Retranscrições
• Domínio médico
Análise de músicas
• Classificação
• Reconhecimento de estilo
• Reconhecimento de compositores
Deteção de ruídos
• Segurança
• Supressão de ruídos (melhoria de produções musicais)
• Análise e separação de fontes sonoras
Geração de música
• Síntese vocal
Ferramentas
• MetaVoice: modificação da voz
• ht: transformação de texto em áudio
• Separação de pistas áudio: AudioStrip
• Síntese vocal: WaveNet
• Áudio e vídeo: Sonix, NVIDIA Jarvi, IBM Watson
• Tratamento de gravações áudio: Amazon Transcribe (retranscrição em texto, análise de conteúdo, estatísticas de palavras-chave, reconhecimento de interlocutor)
• Retranscrição de discurso em tempo real com Amazon Transcribe
Exemplos de exercícios práticos
• Demonstração de “Text to Speech” da IBM Watson
IA generativas
• Princípio de funcionamento
• GAN (Generative Adversarial Network)
Exemplos
• Google MusicLM: MusicLM
• Boomy
• Mubert
• Soundraw
• Beatoven
Geração de música a partir de uma descrição em texto
• Mubert
Exemplos de exercícios práticos
• Criação de faixas de música com Mubert
Evoluções
• Limites
• Geração de música livre de direitos
• Descrição em texto
• Escolha do estilo
Problemas éticos
• Desvio de voz
• Clonagem de voz
Fontes
• Dados utilizados na aprendizagem
Aspetos jurídicos
• Direitos de autor
• Ligações com a indústria musical
Nota: O conteúdo deste programa pode ser objeto de adaptação em função dos níveis, pré-requisitos e necessidades dos participantes.
Facilitador que combina know-how com experiência empresarial e competências pedagógicas, para dar resposta a necessidades operacionais e potenciar a aprendizagem.
Objetivos da formação
- Reconhecer os princípios de funcionamento e saber quais são as ferramentas existentes para o tratamento ou a geração de sons.
Duração da formação
Programa da formação
Introdução
• Definição de um som
• Bases do tratamento de sinal digital
• Diferentes tipos de som
• Tecnologias utilizadas
Intervenção da IA nas diferentes etapas do processo de tratamento do som
• Aplicações
• Música
• Ruídos (industriais, de ambiente)
• Tratamento do sinal
• Machine Learning
• Deep Learning (redes neuronais)
• Gravação
• Triagem de gravações
• Análise
• Geração
Tratamento da voz
• Reconhecimento vocal
• Compreensão e análise de discurso ou de comandos vocais
• Traduções
• Retranscrições
• Domínio médico
Análise de músicas
• Classificação
• Reconhecimento de estilo
• Reconhecimento de compositores
Deteção de ruídos
• Segurança
• Supressão de ruídos (melhoria de produções musicais)
• Análise e separação de fontes sonoras
Geração de música
• Síntese vocal
Ferramentas
• MetaVoice: modificação da voz
• ht: transformação de texto em áudio
• Separação de pistas áudio: AudioStrip
• Síntese vocal: WaveNet
• Áudio e vídeo: Sonix, NVIDIA Jarvi, IBM Watson
• Tratamento de gravações áudio: Amazon Transcribe (retranscrição em texto, análise de conteúdo, estatísticas de palavras-chave, reconhecimento de interlocutor)
• Retranscrição de discurso em tempo real com Amazon Transcribe
Exemplos de exercícios práticos
• Demonstração de “Text to Speech” da IBM Watson
IA generativas
• Princípio de funcionamento
• GAN (Generative Adversarial Network)
Exemplos
• Google MusicLM: MusicLM
• Boomy
• Mubert
• Soundraw
• Beatoven
Geração de música a partir de uma descrição em texto
• Mubert
Exemplos de exercícios práticos
• Criação de faixas de música com Mubert
Evoluções
• Limites
• Geração de música livre de direitos
• Descrição em texto
• Escolha do estilo
Problemas éticos
• Desvio de voz
• Clonagem de voz
Fontes
• Dados utilizados na aprendizagem
Aspetos jurídicos
• Direitos de autor
• Ligações com a indústria musical
Nota: O conteúdo deste programa pode ser objeto de adaptação em função dos níveis, pré-requisitos e necessidades dos participantes.
Formador
Facilitador que combina know-how com experiência empresarial e competências pedagógicas, para dar resposta a necessidades operacionais e potenciar a aprendizagem.
Clique na imagem para expandir
Os nossos espaços de formação oferecem todas as condições para continuar o seu desenvolvimento pessoal e profissional em absoluta segurança
Não se esqueça de subscrever o blog RhBizz e de nos seguir no LindekIn, Facebook, Instagram e Youtube.
















