TIRANDO COELHO NETTO DO PURGATÓRIO? - ANÁLISES LINGUÍSTICO-COMPUTACIONAIS DE TEXTOS LITERÁRIOS DO SEC. XIX E XX | Autores: Francimary Macedo Martins (UFMA - UNIVERSIDADE FEDERAL DO MARANHÃO) |
Resumo: Esta comunicação trata dos resultados obtidos com as análises linguístico-computacionais do Corpus Coelho Netto (CCN), corpus computadorizado de obras literárias do escritor maranhense Coelho Netto, dos séc. XIX e XX, contendo textos dos romances A Conquista e Turbilhão e contos do livro Sertão. Após compilação do CNN este foi submetido à anotação morfossintática e análise linguístico-computacional, com o objetivo de obter dados que comprovem ou não o uso “excessivo” de adjetivos, de verbos e de advérbios em –mente, demonstrando a diversidade lexical nos textos de Coelho Netto, constatando se o que a crítica modernista dizia a respeito do escritor era procedente. Para essa constatação e ou comparação, foi necessário criar o Corpus de Contraste, contendo textos dos modernistas Aluísio Azevedo (O Cortiço) e Camilo Castelo Branco (Amor de Perdição), contemporâneos de Coelho Netto. O trabalho está na interface da Literatura (LIMA, 1958; NISKIER, 2010; MENDES & IGNÁCIO, 2010; MORAES, 1976; BROCA, 1958), da Linguística Computacional e da Linguística de Corpus (BERBER SARDINHA, 2000, 2004; OTHERO & MENUZI, 2005; BIDERMAN, 1998, 2001; ALUÍSIO; ALMEIDA, 2006; ALENCAR, 2009, 2011, 2013). A anotação morfossintática foi realizada pelo etiquetador automático Aelius, modelo AeliusHunPos, um software livre em Python que utiliza a biblioteca Natural Language Toolkit – NLTK (BIRD; KLEIN; LOPER, 2009), no pré-processamento de textos, na construção de etiquetador morfossintático e na anotação de corpora com auxílio de revisão humana (ALENCAR, 2010a, 2013a, 2013b). As análises linguístico-computacionais nos permitiram validar a afirmação que Coelho Netto possuía um rico léxico, mas não exacerbado como os críticos, sobretudo os modernistas, atribuíram a ele.
|
|