Exploração de corpora para extração e descrição de léxico de especialidade
para uma metodologia sólida e sustentada
DOI :
https://doi.org/10.11606/issn.2236-4242.v33i1p69-104Mots-clés :
extração de léxico de especialidade, metodologia, corpora, concordâncias, colocaçõesRésumé
A exploração de corpora para a extração de léxico de especialidade é um método consensual e comum na construção de recursos lexicais. No entanto, as metodologias empregadas não são explicitamente discutidas, dificultando a comparação e a determinação de abordagens robustas. Para preencher essa lacuna, neste artigo apresentamos e discutimos uma metodologia detalhada para extração de léxico de especialidade a partir de corpora, conjugando abordagens linguísticas e estatísticas. O método proposto prevê tanto o uso de corpora de especialidade como de corpora monitores e inclui: i) análise de dados de frequência; ii) extração de concordâncias e colocações; iii) extração de informação de ordem textual, permitindo a extração de unidades lexicais atómicas e multipalavra e de relações semânticas relevantes. Desse modo, o objetivo da metodologia é a determinação de listas de potenciais unidades lexicais de especialidade e de informações relevantes para a sua descrição que permitam uma validação final rápida e eficiente, maximizando o valor informacional da interação com os especialistas.
##plugins.themes.default.displayStats.downloads##
Téléchargements
Publiée
Numéro
Rubrique
Licence
(c) Copyright Linha D'Água 2020
Ce travail est disponible sous licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.
A aprovação dos manuscritos implica cessão imediata e sem ônus dos direitos de publicação para a Linha D'Água. Os direitos autorais dos artigos publicados pertencem à instituição a qual a revista encontra-se vinculada. Em relação à disponibilidade dos conteúdos, a Linha D'Água adota a Licença Creative Commons, CC BY-NC Atribuição não comercial. Com essa licença é permitido acessar, baixar (download), copiar, imprimir, compartilhar, reutilizar e distribuir os artigos, desde que para uso não comercial e com a citação da fonte, conferindo os devidos créditos autorais à revista.
Nesses casos, em conformidade com a política de acesso livre e universal aos conteúdos, nenhuma permissão é necessária por parte dos autores ou do Editor. Em quaisquer outras situações a reprodução total ou parcial dos artigos da Linha D'Água em outras publicações, por quaisquer meios, para quaisquer outros fins que sejam natureza comercial, está condicionada à autorização por escrito do Editor.
Reproduções parciais de artigos (resumo, abstract, resumen, partes do texto que excedam 500 palavras, tabelas, figuras e outras ilustrações) requerem permissão por escrito dos detentores dos direitos autorais.
Reprodução parcial de outras publicações
Citações com mais de 500 palavras, reprodução de uma ou mais figuras, tabelas ou outras ilustrações devem ter permissão escrita do detentor dos direitos autorais do trabalho original para a reprodução especificada na revista Linha D'Água. A permissão deve ser endereçada ao autor do manuscrito submetido. Os direitos obtidos secundariamente não serão repassados em nenhuma circunstância.
Comment citer
##plugins.generic.funding.fundingData##
-
Fundação para a Ciência e a Tecnologia
##plugins.generic.funding.funderGrants## PD/BD/128131/2016