Use este identificador para citar ou linkar para este item: https://repositorio.cgu.gov.br/handle/1/42035
Título: Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública
Autor(es): Paiva, Eduardo Soares de
Tipo: Dissertação
Resumo: Os portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Proces for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros.
Observações/Notas: pg. 111
Local de edição: Rio de Janeiro (RJ)
Unidade Organizacional do Submetedor: UNIDADE::SECRETARIA-EXECUTIVA (SE)::DIRETORIA DE GESTÃO INTERNA (DGI)::Coordenação-Geral de Gestão de Pessoas (COGEP)
Área temática: Prevenção da Corrupção, Integridade e Transparência Pública
Assunto(s): ASSUNTO::Prevenção da Corrupção::Transparência Pública
Palavras-chave: Mineração de texto
Tratamento de dados
Processamento intensivo de dados
Data do documento: Fev-2017
URI: https://basedeconhecimento.cgu.gov.br/handle/1/6343
Detentor de Direitos Autorais: Eduardo Soares de Paiva
Permissões e restrições de uso: Licenças::Creative commons uso não comercial - não a obras derivadas (CC-by-nc-nd)::Licença que permite que outros façam download das obras licenciadas e as compartilhem, contanto que mencionem o autor, mas sem poder modificar a obra de nenhuma forma, nem utilizá-la para fins comerciais.
Aparece nas coleções:Dissertações – Prevenção da Corrupção, Integridade e Transparência Pública

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tese_Mestrado_2017.pdf9.25 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.