Web Scraping at INPI: a resource for patent information analysis
DOI:
https://doi.org/10.9771/cp.v19i1.64393Keywords:
Technology foresight, Web Scraping, Patents.Abstract
The manual retrieval of large volumes of information presents significant challenges in terms of time and accuracy, increasing the risk of errors. In this context, automated techniques such as data scraping emerge as efficient alternatives to support technological prospecting, enabling precise and rapid extraction of information from open-access online databases. This study, derived from a professional master’s degree research project, presents a methodology built using a data scraping technique developed in Python programming language, applied to the patent search portal of the National Institute of Industrial Property (INPI), with the institutional support of Power BI. The applied method demonstrated its effectiveness in organizing and structuring large volumes of patent data, providing a solid foundation for future research in technological prospecting. The technique proved especially relevant for patentometric studies, expediting the retrieval of information for analyses in emerging areas of global importance.
Downloads
References
AMPARO, K. K. D. S.; RIBEIRO, M. D. C. O.; GUARIEIRO, L. L. N. Estudo de caso utilizando mapeamento de prospecção tecnológica como principal ferramenta de busca científica. Perspectivas em Ciência da Informação, Belo Horizonte, v. 17, n. 4, p. 195-209, out.-dez. 2012.
BALTAZAR, L. F. et al. Patentes como fonte de informação tecnológica para subsídio à pesquisa: uma análise amostral da Universidade Federal do ABC. Cadernos de Prospecção, Salvador, v. 10, n. 4, p. 681-681, 2017.
BRASIL. Lei n. 9.279, de 14 de maio de 1996. Regula direitos e obrigações relativos a propriedade industrial. Diário Oficial da União, Brasília, DF, 15 de maio 1996.
BRASIL. Ministério da Saúde. Conselho Nacional de Saúde. Resolução n. 510, de 7 de abril de 2016. Trata sobre as diretrizes e normas regulamentadoras de pesquisa em ciências humanas e sociais. Diário Oficial da União, Brasília, DF, seção 1, n. 98, p. 44, 24 de maio de 2016.
BROUCKE, S. V.; BAESENS, B. Practical web scraping for data science: best practices and examples with python. Birmingham: Packt Publishing, 2020.
GUZMÁN SÁNCHEZ, M. V. Patentometría: herramienta para el análisis de oportunidades tecnológicas. 1999. 130f. Tese (Doutorado em Gerência de Información Tecnológica) – Facultad de Economia, Universidade de La Habana, Havana, 1999.
HAIR JR., J. F. et al. Multivariate data analysis. 7. ed. London: Pearson, 2010.
INPI – INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL. Resolução n. 175, de 5 de novembro de 2016. Disciplina o exame prioritário de pedidos de “Patente Verde”. Rio de Janeiro: INPI, 2016.
INPI – INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL. Busca de patentes. 2022. Disponível em: https://busca.inpi.gov.br/pePI/. Acesso em: 11 jan. 2025.
INPI – INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL. Portaria INPI n. 247/2020. 2020. Disciplina o trâmite prioritário de processos de patentes no âmbito do INPI.
JUNGMANN, D. M. A caminho da inovação: proteção e negócios com bens de propriedade intelectual: guia para o empresário. Brasília, DF: IEL, 2010.
KLINE, R. B. Principles and practice of structural equation modeling. 4. ed. New York: Guilford Press, 2016.
KUPFER, D.; TIGRE, P. B. Prospecção tecnológica. In: CARUSO, L. A.; TIGRE, P. B. (org.). Modelo SENAI de prospecção: documento metodológico. Montevideo: OIT/Cinterfor, 2004. p. 17-35.
LAWSON, R. Web Scraping with Python: scrape data from any website with the power of Phython. Packt: Birmingham, 2021.
LEÃO, A. P. S. et al. Power BI para tomada de decisões estratégicas: análise de indicadores-chave de desempenho (KPIS). Revista Foco, Curitiba, v. 16, n. 7, e2472, p. 1-28, 2023. Disponível em: https://ojs.focopublicacoes.com.br/foco/article/view/2472. Acesso em: 11 jan. 2025.
MCKINNEY, W. Python for data analysis. O'Reilly Media: Sebastopol, 2018.
MITCHELL, R. Web scraping com Python: coletando mais dados da web moderna. O'Reilly Media: Sebastopol, 2018.
NARIN, F.; BREITZMAN, A.; THOMAS, P. Using patent citation indicators to manage a stock portfolio. In: MOED, H. F. et al. Handbook of Quantitative Science and Technology Research: the use of publication and patent statistics in studies of S&T systems. 2005. p. 553-568.
PARANHOS, R. D. C. S.; RIBEIRO, N. M. Importância da prospecção tecnológica em base em patentes e seus objetivos da busca. Cadernos de Prospecção, Salvador, v. 5, n. 1, p. 1274, 2018.
QUINTELLA, C. M. et al. Prospecção tecnológica como uma ferramenta aplicada em ciência e tecnologia para se chegar à inovação. Revista Virtual de Química, Niterói, v. 3, n. 5, p. 406-415, dez. 2011.
SANTOS, N. J. B.; SANTOS, M. J. C. Mapeamento do desenvolvimento tecnológico de patentes verdes relacionadas ao gerenciamento de resíduos. Cadernos de Prospecção, Salvador, v. 11, n. 1, p. 17-25, jan.-mar. 2018.
TEIXEIRA, R. C.; SOUZA, R. R. O uso das informações contidas em documentos de patentes nas práticas de inteligência competitiva: apresentação de um estudo das patentes da UFMG. Perspectivas em Ciência da Informação, Belo Horizonte, v. 18, n. 1, p. 106-125, jan.-mar. 2013.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Cadernos de Prospecção

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
O autor declara que: - Todos os autores foram nomeados. - Está submetendo o manuscrito com o consentimento dos outros autores. - Caso o trabalho submetido tiver sido contratado por algum empregador, tem o consentimento do referido empregador. - Os autores estão cientes de que é condição de publicação que os manuscritos submetidos a esta revista não tenham sido publicados anteriormente e não sejam submetidos ou publicados simultaneamente em outro periódico sem prévia autorização do Conselho Editorial. - Os autores concordam que o seu artigo ou parte dele possa ser distribuído e/ou reproduzido por qualquer forma, incluindo traduções, desde que sejam citados de modo completo esta revista e os autores do manuscrito. - Revista Cadernos de Prospecção está licenciado com uma Licença Creative Commons Attribution 4.0. Esta licença permite que outros remixem, adaptem e criem a partir do seu trabalho para fins não comerciais, e embora os novos trabalhos tenham de lhe atribuir o devido crédito e não possam ser usados para fins comerciais, os usuários não têm de licenciar esses trabalhos derivados sob os mesmos termos.
Este obra está licenciado com uma Licença Creative Commons Atribuição 4.0 Internacional.


