Please use this identifier to cite or link to this item: https://repositorio.cgu.gov.br/handle/1/34871
Title: Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública
Authors: Paiva, Eduardo Soares de
metadata.dc.type: Dissertação
metadata.dc.location: Rio de Janeiro (RJ)
metadata.dc.subject.areas: UNIDADE::SECRETARIA-EXECUTIVA (SE)::DIRETORIA DE GESTÃO INTERNA (DGI)::Coordenação-Geral de Gestão de Pessoas (COGEP)
metadata.dc.subject.classification: Prevenção da Corrupção, Integridade e Transparência Pública
metadata.dc.subject.vccgu: ASSUNTO::Prevenção da Corrupção::Transparência Pública
metadata.dc.subject.keyword: Mineração de texto
Tratamento de dados
Processamento intensivo de dados
Issue Date: Feb-2017
Abstract: Os portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Proces for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros.
URI: https://basedeconhecimento.cgu.gov.br/handle/1/6343
metadata.dc.description.additionalinformation: pg. 111
metadata.dc.rights.holder: Eduardo Soares de Paiva
metadata.dc.rights.license: Licenças::Creative commons uso não comercial - não a obras derivadas (CC-by-nc-nd)::Licença que permite que outros façam download das obras licenciadas e as compartilhem, contanto que mencionem o autor, mas sem poder modificar a obra de nenhuma forma, nem utilizá-la para fins comerciais.
Appears in Collections:Dissertações – Prevenção da Corrupção, Integridade e Transparência Pública

Files in This Item:
File Description SizeFormat 
Tese_Mestrado_2017.pdf9.25 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.