PARAMETRIZAÇÃO DE SINAIS DE FALA UTILIZANDO O MFCC

Autores

  • Wellington Freitas
  • Wellington Lopes de Freitas
  • Fabiano Tondello Castoldi

Palavras-chave:

Processamento, Fala, Extração, Parâmetros, MFCC

Resumo

Atualmente existe um crescimento de aplicações que realizam tarefas por comandos de fala utilizando sistemas de reconhecimento automático de fala (AutomaticSpeech Recognition -ASR). Exemplos de uso desse tipo de aplicações são os aplicativos conhecidos como Google now, Apple Siri e Microsoft Cortana. Um sistema ASR é composto por diversos subsistemas como: sistema de processamento de sinais, sistema de decodificação, sistema de modelagem acústica etc. Em especial o bloco de processamento de sinais é responsável pela parametrização e extração de características linguísticas utilizadas para classificar um sinal de fala. Existem hoje diversas técnicas para a realização desta tarefa, as quais aproveitam-se de mecanismos de produção e compreensão humana da fala para a implementação do bloco de processamento de sinais. Atualmente a técnica que possuí o maior sucesso para essa finalidade são os coeficientes cepstrais de frequência Mel (Mel-Frequency Cepstral Coefficients MFCC). Baseado nessas considerações, este trabalho tem por objetivo apresentar o projeto de todos os submódulos que compõem um subsistema de processamento de sinais em um sistema ASR utilizando a técnica MFCC para extração de parâmetros de sinais de fala relevantes para sua futura classificação.

Downloads

Os dados de download ainda não estão disponíveis.

Downloads

Publicado

2020-03-03

Como Citar

PARAMETRIZAÇÃO DE SINAIS DE FALA UTILIZANDO O MFCC. Anais do Salão Inovação, Ensino, Pesquisa e Extensão, [S. l.], v. 10, n. 2, 2020. Disponível em: https://periodicos.unipampa.edu.br/index.php/SIEPE/article/view/100604. Acesso em: 19 abr. 2026.