Evento abordou técnicas de extração e sumarização de dados em textos jurídicos para automatizar e simplificar pesquisas empíricas na área do Direito.
No dia 9 de setembro, os professores Fábio José Ayres e Danilo Carlotti promoveram um workshop de pesquisa para abordar a análise de textos jurídicos por meio de ferramentas computacionais.
No encontro, foram apresentadas técnicas de extração e sumarização de textos jurídicos para fins de pesquisa empírica em direito. Os exemplos e materiais apresentados no evento foram relativos às pesquisas do Insper em projetos aprovados pelo Conselho Nacional de Justiça (CNJ).
Entre os assuntos discutidos no workshop, Fábio e Danilo apresentaram o site regex101.com, que permite buscar registros em documentos de forma avançada, e destacaram modos de trabalhar com expressões regulares, quantificadores e agrupamentos com o objetivo de tornar a pesquisa adequada e eficiente.
“Dessa forma, é possível localizar rapidamente dados específicos, como o número CNJ, no caso dos documentos que estamos analisando, e montar tabelas de modo que mais nos interessem. Isso pode ser expandido para os mais diversos dados, desde que notemos o seu devido formato e consigamos definir a expressão que vai identificá-lo em meio aos demais”, explicou Danilo. “Sabendo como montar essas expressões regulares e com um conhecimento básico de programação em Python é possível criar um pequeno programa para automatizar a localização de termos em seus documentos”, disse Fábio.
“Essas técnicas possibilitam saber a ocorrência de determinadas citações em centenas de documentos sem a necessidade de consultá-los de forma única, além da viabilidade de extrair alguma informação em particular em meio a uma grande quantidade de dados”, ressaltou Paulo Furquim, Coordenador do Centro de Regulação e Democracia do Insper.