Desenvolvimento de software para análise linguística | Autores: Guilherme Fromm (UFU - Universidade Federal de Uberlândia) |
Resumo: O objetivo desta apresentação é mostrar algumas metodologias adotadas, no Instituto de Letras e Linguística da Universidade Federal de Uberlândia, para o desenvolvimento de um ecossistema de pesquisas baseadas em corpora e ferramentas computacionais para análises linguísticas, seja em trabalhos com línguas isoladas (como o português, o inglês, o alemão, etc.), seja em trabalhos bilíngues (como no par português/inglês). Em primeiro lugar, mostramos como um trabalho de uma disciplina, em sala de aula, se transformou num projeto colaborativo de construção de um corpus bilíngue da área de Linguística no par português/inglês e se tornou o propulsor para todos os projetos futuros. Na sequência, explicamos uma das ferramentas propostas, que é o desenvolvimento de uma página de consulta ao corpus gerado (e que, também, abrigará todos os corpora elaborados dentro dos grupos de pesquisa GPELC, PLex e GECon), nos moldes da ferramenta CORTEC (Projeto COMET, FFLCH/USP). Por fim, a partir de uma ferramenta já existente (VoTec, FROMM, 2007) e em conjunção com vários projetos de pesquisa que têm como abordagem e base metodológica a Linguística de Corpus (LC), apresentamos as motivações e resultados de programas (já finalizados ou ainda em desenvolvimento): VoTec versão 1.1 (CARDOSO, 2017), VoTec versão 1.2 (FROMM, YAMAMOTO, 2018), CELV (PEIXOTO, 2016), UltraLex (FROMM, 2017), ToGatherUp (OLIVEIRA, 2018), Grama (2018, ainda na fase teórica), Beilke (2018, ainda na fase teórica). Além da metodologia da LC, utilizamos bases teóricas em várias subáreas da Linguística: Lexicologia/grafia, Terminologia/grafia, Linguística Textual, Semântica Argumentativa, Dialetologia, Ensino/Aprendizagem de Língua Materna e de Língua Estrangeira, etc.
|
|