Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública

Arquivos deste documento

ArquivoTamanhoFormatoVisualizar
Tese_Mestrado_2017.pdf9.04 MBPDF
Carregando...
Imagem de Miniatura

Título
Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública
Autor
Paiva, Eduardo Soares de
Tipo
Dissertação
Resumo
Os portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Proces for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros.
Local de edição
Rio de Janeiro (RJ)
Unidade Organizacional do Submetedor
UNIDADE::SECRETARIA-EXECUTIVA (SE)::DIRETORIA DE GESTÃO INTERNA (DGI)::Coordenação-Geral de Gestão de Pessoas (COGEP)
Área temática
Prevenção da Corrupção, Integridade e Transparência Pública
Assunto
ASSUNTO::Prevenção da Corrupção::Transparência Pública
Palavras-chaves
Mineração de texto
Tratamento de dados
Processamento intensivo de dados
Data do documento
2017-02
Detentor de Direitos Autorais
Eduardo Soares de Paiva
Permissões e restrições de uso
Licenças::Creative commons uso não comercial - não a obras derivadas (CC-by-nc-nd)::Licença que permite que outros façam download das obras licenciadas e as compartilhem, contanto que mencionem o autor, mas sem poder modificar a obra de nenhuma forma, nem utilizá-la para fins comerciais.