Reconhecimento de Orador em Dois Segundos

Descrição e Objectivos

O trabalho que se pretende desenvolver consiste numa solução de reconhecimento de orador, especificamente do âmbito de identificação de orador independente de texto. A implementação do sistema deve ter em vista a redução do tempo das amostras de voz necessárias para a identificação, mantendo níveis de robustez elevados, comparáveis a soluções do estado da arte. O objectivo é reduzir esse tempo para cerca de dois segundos. Para isto serão estudadas formas de optimizar os métodos já existentes e extensamente utilizados actualmente, e serão também explorados novos métodos, com características que indiquem potencial capacidade de alcançar o objectivo pretendido. Através da revisão bibliográfica já efectuada verificou-se que a área que se encontra em maior exploração, com vista ao aumento da robustez das soluções existentes e à diminuição da duração das amostras de voz utilizadas, é a de extracção de características da voz. Estão a ser exploradas novas possibilidades como a extracção de características da fonte glótica, sendo que este trabalho irá incidir em grande parte no estudo desses novos métodos.

Ferramentas

Para desenvolvimento dos algoritmos e estudo dos diferentes métodos a principal ferramenta utilizada é o Matlab. São utilizadas também várias toolboxes para o Matlab, com funções desenvolvidas especialmente para a análise da voz e para sistemas de reconhecimento de orador e de fala - em especial a VoiceBox e a Auditory Toolbox
Toolboxes relativas a análise de dados estatísticos, especializadas em pattern recognition, são também utilizadas, como a Pattern Recognition Toolbox, Statistical Pattern Recognition Toolbox e a Statistics Toolbox incorporada já no Matlab. Para este fim de data mining será utilizado também o software Weka.