Comparative study of full-text indexing for information retrieval in database management systems
DOI:
https://doi.org/10.11606/issn.2178-2075.v10i1p281-301Keywords:
Automatic indexing, Information retrieval, Relevance, Full-text databaseAbstract
Full-Text Indexing is a functionality of Database Management Systems (DBMS) that enables the search and retrieval of information in text documents in efficient way. In this sense, the characteristics of the full-text indexing functionality of three software products were studied and compared, aiming undersatand the appropriate solution under the perspective of functionality characteristics and performance of the complete indexing of texts for the retrieval of information. In this context, the theoretical basis of the automatic indexing process was described, as well as the main algorithms used to calculate relevance for information retrieval. The Microsoft SQL Server, Oracle Database and PostgreSQL software products were also tested and compared in terms of indexing and searching the documents stored in these DBMS. The results show that the choice of a DBMS will depend on its applicability, being based on the type of document to be indexed, functionalities implemented in the DBMS and budget for software investment.
Downloads
Downloads
Published
Issue
Section
License
Ao encaminhar textos à InCID: Revista de Ciência da Informação e Documentação, o autor concorda com as prerrogativas do DOAJ para periódicos de acesso aberto adotadas pela revista:
- concessão à revista o direito de primeira publicação sob a Licença Creative Commons Attribution (CC BY 4.0), que permite acessar, imprimir, ler, distribuir, remixar, adaptar e desenvolver outros trabalhos, com reconhecimento da autoria.
- autorização para distribuição não exclusiva da versão do trabalho publicado nesta revista , como a publicação em repositorios institucionais desde que o reconhecimento da autoria e publicação inicial na InCID
- leitores podem ler, fazer download, distribuir, imprimir, linkar o texto completo dos arquivos sem pedir permissão prévia aos autores e/ou editores, desde que respeitado o estabelecido na Licença Creative Commons Attribution (CC BY 4.0).
O trabalho publicado é considerado colaboração e, portanto, o autor não receberá qualquer remuneração para tal, bem como nada lhe será cobrado em troca para a publicação.
Os textos são de responsabilidade de seus autores. Citações e transcrições são permitidas mediante menção às fontes.