Estudo comparativo de indexação complete de texto para recuperação de informações em sistemas gerenciadores de banco de dados
DOI:
https://doi.org/10.11606/issn.2178-2075.v10i1p281-301Palavras-chave:
Indexação automática, Recuperação de informação, Relevância, Bases de dados de textos completosResumo
A indexação completa de textos é uma funcionalidade dos Sistemas Gerenciadores de Bancos de Dados (SGBD) que possibilita a pesquisa e recuperação de informações em documentos de textos de forma eficiente. Dessa forma, foram estudadas e comparadas as características da indexação completa de textos de três produtos de software, objetivando entender a solução mais adequada sob a perspectiva de características das funcionalidades e desempenho da indexação completa de textos destinados a recuperação de informação. Nesse contexto, foi descrita a fundamentação teórica sobre o processo de indexação automática destacando os principais algoritmos utilizados para cálculo de relevância para recuperação de informações. Também foram testados e comparados os produtos de software Microsoft SQL Server, Oracle Database e PostgreSQL no que tange à indexação e pesquisa dos documentos armazenados nesses SGBD. Os resultados demonstram que a escolha de um SGBD irá depender da aplicabilidade do mesmo, sendo fundamentada pelo tipo de documento a ser indexado, funcionalidades implementadas no SGBD e orçamento para investimento em software.
Downloads
Downloads
Publicado
Edição
Seção
Licença
Ao encaminhar textos à InCID: Revista de Ciência da Informação e Documentação, o autor concorda com as prerrogativas do DOAJ para periódicos de acesso aberto adotadas pela revista:
- concessão à revista o direito de primeira publicação sob a Licença Creative Commons Attribution (CC BY 4.0), que permite acessar, imprimir, ler, distribuir, remixar, adaptar e desenvolver outros trabalhos, com reconhecimento da autoria.
- autorização para distribuição não exclusiva da versão do trabalho publicado nesta revista , como a publicação em repositorios institucionais desde que o reconhecimento da autoria e publicação inicial na InCID
- leitores podem ler, fazer download, distribuir, imprimir, linkar o texto completo dos arquivos sem pedir permissão prévia aos autores e/ou editores, desde que respeitado o estabelecido na Licença Creative Commons Attribution (CC BY 4.0).
O trabalho publicado é considerado colaboração e, portanto, o autor não receberá qualquer remuneração para tal, bem como nada lhe será cobrado em troca para a publicação.
Os textos são de responsabilidade de seus autores. Citações e transcrições são permitidas mediante menção às fontes.