Imprimir Resumo


Simpósio Mundial de Estudos de Língua Portuguesa
Resumo


Detecção automática de fronteiras prosódicas a partir de parâmetros fonético-acústicos: Um estudo baseado no corpus C-ORAL-BRASIL

Autores:
Bárbara Teixeira (UFMG - Universidade Federal de Minas Gerais)

Resumo:

Para compreender adequadamente a organização e a estruturação do discurso falado, é necessário segmentar a fala em unidades entonacionais delimitadas por fronteiras prosódicas. São apontados alguns parâmetros fonético-acústicos básicos para descrever o estabelecimento de fronteiras, como o reset da frequência fundamental, o alongamento pré-fronteiriço e fronteiriço, a mudança na taxa de elocução e a pausa silenciosa. Contudo, algumas fronteiras perceptivelmente relevantes não são marcadas pelos parâmetros tradicionalmente apontados. Este trabalho utiliza dados de corpora de fala espontânea para investigar os parâmetros fonético-acústicos que orientam a produção e a percepção de fronteiras prosódicas. Sete trechos de fala espontânea monológica masculina foram segmentados em unidades entonacionais por segmentadores treinados. As fronteiras prosódicas percebidas pelos segmentadores foram anotadas como terminais (conclusivas) ou não terminais (não conclusivas). Um script do Praat foi utilizado para extrair automaticamente parâmetros fonético-acústicos ao longo do sinal acústico. Os parâmetros extraídos compreendem medidas de: 1) Speech rate e ritmo; 2) Duração normalizada e suavizada do segmento silábico; 3) Frequência fundamental; 4) Intensidade; 5) Pausa silenciosa. Com o objetivo de gerar modelos compostos pela combinação de múltiplos parâmetros fonético-acústicos que poderiam funcionar como preditores da realização das fronteiras, os parâmetros extraídos foram submetidos a dois métodos de classificação estatística, a saber Random Forest (RF) e Linear Discriminant Analysis (LDA). A avaliação inicial dos classificadores mostra que ambos classificadores apresentam sucesso relativo na classificação das fronteiras. No entanto, o LDA apresentou um melhor desempenho para predizer a realização das fronteiras. Por isso, os modelos obtidos por meio do LDA foram refinados. O modelo final destinado à detecção automática de fronteiras terminais apresenta uma convergência de 80% em relação às fronteiras terminais identificadas pelos segmentadores. Para as fronteiras não terminais, foram obtidos três modelos. Juntos, os três modelos apresentam uma convergência de 98% em relação às fronteiras não terminais indicadas pelos segmentadores.


Agência de fomento:
CAPES