Exploração de corpora para extração e descrição de léxico de especialidade

para uma metodologia sólida e sustentada

Auteurs

DOI :

https://doi.org/10.11606/issn.2236-4242.v33i1p69-104

Mots-clés :

extração de léxico de especialidade, metodologia, corpora, concordâncias, colocações

Résumé

A exploração de corpora para a extração de léxico de especialidade é um método consensual e comum na construção de recursos lexicais. No entanto, as metodologias empregadas não são explicitamente discutidas, dificultando a comparação e a determinação de abordagens robustas. Para preencher essa lacuna, neste artigo apresentamos e discutimos uma metodologia detalhada para extração de léxico de especialidade a partir de corpora, conjugando abordagens linguísticas e estatísticas. O método proposto prevê tanto o uso de corpora de especialidade como de corpora monitores e inclui: i) análise de dados de frequência; ii) extração de concordâncias e colocações; iii) extração de informação de ordem textual, permitindo a extração de unidades lexicais atómicas e multipalavra e de relações semânticas relevantes. Desse modo, o objetivo da metodologia é a determinação de listas de potenciais unidades lexicais de especialidade e de informações relevantes para a sua descrição que permitam uma validação final rápida e eficiente, maximizando o valor informacional da interação com os especialistas.

##plugins.themes.default.displayStats.downloads##

##plugins.themes.default.displayStats.noStats##

Publiée

2020-03-25

Comment citer

BARBERO, Chiara; AMARO, Raquel. Exploração de corpora para extração e descrição de léxico de especialidade: para uma metodologia sólida e sustentada. Linha D’Água, São Paulo, v. 33, n. 1, p. 69–104, 2020. DOI: 10.11606/issn.2236-4242.v33i1p69-104. Disponível em: https://journals.usp.br/linhadagua/article/view/165214.. Acesso em: 24 nov. 2024.

##plugins.generic.funding.fundingData##