{"id":736,"date":"2020-12-28T14:36:23","date_gmt":"2020-12-28T14:36:23","guid":{"rendered":"https:\/\/capitalfinanceiro.com.br\/?p=736"},"modified":"2022-11-11T19:22:58","modified_gmt":"2022-11-11T19:22:58","slug":"por-que-web-scraping-e-vital-para-a-democracia","status":"publish","type":"post","link":"https:\/\/capitalfinanceiro.com.br\/por-que-web-scraping-e-vital-para-a-democracia\/","title":{"rendered":"Por que web scraping \u00e9 vital para a democracia"},"content":{"rendered":"

Os frutos da web scraping – usando c\u00f3digo para coletar dados e informa\u00e7\u00f5es de sites – est\u00e3o \u00e0 nossa volta.<\/p>\n

As pessoas constroem scrapers que podem\u00a0localizar todos os Applebee’s<\/strong> do planeta\u00a0ou\u00a0coletar legisla\u00e7\u00e3o e votos do Congresso\u00a0ou\u00a0rastrear rel\u00f3gios sofisticados \u00e0 venda\u00a0em sites de f\u00e3s.\u00a0As empresas usam raspadores para\u00a0gerenciar seu estoque de varejo online\u00a0e monitorar\u00a0os pre\u00e7os dos concorrentes\u00a0.\u00a0Muitos sites conhecidos usam scrapers para fazer coisas como\u00a0rastrear pre\u00e7os de passagens a\u00e9reas\u00a0e\u00a0listas de empregos\u00a0.\u00a0O Google<\/strong> \u00e9 essencialmente um gigante e rastejante raspador da web.<\/p>\n

Raspadores tamb\u00e9m s\u00e3o ferramentas de c\u00e3es de guarda e jornalistas, e \u00e9 por isso que o The Markup entrou com um\u00a0amicus brief\u00a0em um caso perante a Suprema Corte dos Estados Unidos nesta semana que amea\u00e7a tornar o raspado ilegal.<\/p>\n

O caso em si –\u00a0Van Buren v. Estados Unidos<\/em>\u00a0– n\u00e3o \u00e9 sobre raspagem, mas sim uma quest\u00e3o legal relacionada ao processo contra um policial da Ge\u00f3rgia, Nathan Van Buren, que foi subornado para pesquisar informa\u00e7\u00f5es confidenciais em um banco de dados da pol\u00edcia.\u00a0Van Buren foi processado de acordo com a Lei de Fraude e Abuso de Computador (CFAA), que pro\u00edbe o acesso n\u00e3o autorizado a uma rede de computadores, como hacking de computador, onde algu\u00e9m invade um sistema para roubar informa\u00e7\u00f5es (ou, como dramatizado no cl\u00e1ssico filme dos anos 1980 \u201c\u00a0WarGames\u00a0, \u201dPotencialmente iniciar a III Guerra Mundial).<\/p>\n

\"\"
Por que web scraping \u00e9 vital para a democracia<\/figcaption><\/figure>\n

No caso de Van Buren, uma vez que ele teve permiss\u00e3o para acessar o banco de dados para trabalhar, a quest\u00e3o \u00e9 se o tribunal definir\u00e1 amplamente suas atividades problem\u00e1ticas como \u201cexceder o acesso autorizado\u201d para extrair dados, o que \u00e9 o que tornaria isso um crime sob a CFAA.\u00a0E \u00e9 essa defini\u00e7\u00e3o que pode afetar os jornalistas.<\/p>\n

Ou, como disse o juiz Neil Gorsuch durante os argumentos orais de segunda-feira, conduza na dire\u00e7\u00e3o de \u201ctalvez fazer de todos n\u00f3s um criminoso federal\u201d.<\/p>\n

Jornalistas investigativos e outros vigilantes costumam usar raspadores para esclarecer quest\u00f5es grandes e pequenas, desde\u00a0rastrear a influ\u00eancia de lobistas no Peru,\u00a0coletando\u00a0os\u00a0registros digitais de visitantes de pr\u00e9dios do governo at\u00e9\u00a0monitorar e coletar\u00a0an\u00fancios pol\u00edticos no Facebook.\u00a0Em ambos os casos, as p\u00e1ginas e os dados extra\u00eddos est\u00e3o dispon\u00edveis publicamente na Internet – sem necessidade de hacking – mas os sites envolvidos podem facilmente alterar as letras mi\u00fadas de seus termos de servi\u00e7o para rotular a agrega\u00e7\u00e3o dessas informa\u00e7\u00f5es como “n\u00e3o autorizada”.\u00a0E a Suprema Corte dos Estados Unidos, dependendo de como governar, pode decidir que violar esses termos de servi\u00e7o \u00e9 crime segundo o CFAA.<\/p>\n

\u201cUm estatuto que permite que for\u00e7as poderosas como o governo ou atores corporativos ricos criminalizem unilateralmente as atividades de coleta de not\u00edcias, bloqueando esses esfor\u00e7os por meio dos termos de servi\u00e7o de seus sites, violaria a Primeira Emenda\u201d, escreveu The Markup em nosso relat\u00f3rio.<\/p>\n

Que tipo de trabalho est\u00e1 em risco?\u00a0Aqui est\u00e1 um resumo de algum jornalismo recente possibilitado por web scraping:<\/p>\n