Outras Palavras, https://outraspalavras.net/outrasmidias/como-a-big-data-coloniza-a-educacao-brasileira/ , 11/01/2023
Como a Big Data coloniza a Educação brasileira
Google e Microsoft criam parcerias com secretarias estaduais. “Gerenciam” dados públicos valiosos. Lucram com o ensino remoto – e com o desmonte da infraestrutura digital das universidades. Como, então, regular essa captura de autonomia?
Leonardo Cruz em entrevista a André Antunes, na EPSJV/Fiocruz
O avanço das tecnologias digitais desenvolvidas por grandes empresas como Google e Microsoft sobre a educação pública no Brasil tem causado preocupação entre pesquisadores da área. Um processo cujos marcos iniciais se deram a partir de meados da década passada na educação superior, principalmente devido a demanda crescente por infraestrutura para armazenamento de e-mails nas instituições, cujos orçamentos vêm passando por sucessivos cortes ano após ano, mas que se espraiou com velocidade também na educação básica, devido à demanda criada pela adoção do ensino remoto durante a pandemia de Covid-19. Nesta entrevista, o pesquisador Leonardo Cruz, da Universidade Federal do Pará (UFPA), membro da Rede Latino-Americana de Estudos sobre Vigilância, Tecnologia e Sociedade (Lavits), argumenta que a dependência crescente dos serviços públicos em relação a empresas como a Google é motivo de alerta, uma vez que ainda há muito pouca transparência sobre o que é feito dos dados educacionais obtidos de milhões de estudantes, professores e gestores a partir do uso de ferramentas desenvolvidas pelas empresas. Para ele, a apropriação privada de uma quantidade enorme de dados digitais produzidos pelos serviços públicos brasileiros e seu armazenamento em data centers localizados nos Estados Unidos — cujas leis que regulamentam o acesso a esses dados são mais flexíveis e não têm sido capazes de conter vazamentos frequentes — levanta dilemas políticos que precisam ser encarados com urgência.
Você utiliza o conceito de ‘capitalismo de vigilância’ como chave de leitura para compreender o processo de avanço das tecnologias digitais sobre a educação pública. Pode falar mais sobre ele?
O conceito foi criado pela socióloga estadunidense Shoshana Zuboff. Ela foi a primeira autora que conseguiu dar uma forma teórica a um modelo de negócio, um novo avanço do capitalismo digital, a possibilidade de criar um mercado sobre os dados gerados nas nossas comunicações mediadas pelas tecnologias digitais. Ela começou a pesquisar isso com a digitalização dos escritórios, na década de 1980 ainda, quando começaram a pensar as possibilidades de conhecimento e controle sobre um espaço através dos dados que ele gera. Isso começou a se dar através de um controle do trabalho dentro dos espaços informatizados, datificados. E um ponto interessante é que o começo da exploração desses dados se deu a partir de dados gerados automaticamente no funcionamento de qualquer programa conectado em rede, por uma questão da própria organização do programa: que máquina conectou com que máquina, que horas essa máquina entrou no sistema, que horas saiu, o que foi comunicado entre uma máquina e outra. São dados utilizados com um propósito de funcionamento da internet, das redes, da possibilidade protocolar de comunicação entre computadores. O pulo do gato é que agora já existem dados que são coletados especialmente para vigilância econômica. Mas a princípio começaram a ver que esses dados eram valiosos como forma de conhecimento sobre uma população. Essa primeira população foram os trabalhadores de escritórios. Foi a Google quem teve a ideia pioneira de conhecer como as pessoas utilizam seus aplicativos e plataformas e entender como ela poderia utilizar isso como commodity dentro de toda a estrutura capitalista.
As empresas mais valiosas do mercado financeiro hoje têm atividades voltadas a coleta de dados e produção de plataformas. E isso se tornou uma mercadoria muito valiosa, altamente centralizada, monopolizada por um pequeno número de grandes empresas e que agora estrutura as demais esferas da sociedade, sobretudo a educação pública, o trânsito, as comunicações, várias esferas de trabalho, de sociabilidade. E isso começa a entrar no nível infraestrutural, o que torna a gente cada vez mais dependente dessas plataformas.
Como esses dados viram mercadorias?
O processo é assim: existe uma quantidade enorme de dados que são produzidos na utilização das ferramentas, por exemplo, da Google. Ela consegue coletar esses dados em grandes bancos de dados e através do trabalho de sociólogos, psicólogos, cientistas de dados, etc, contratados pela Google, consegue dar um sentido a esses dados, um sentido de informação, consegue agrupá-los por idade, por desejos, bebidas que tomam, os lugares que saem, horários que saem à noite, e transformam aquilo no que ela chama de produtos de previsibilidade. Esse é na verdade o grande mercado da Google. Nós somos a matéria prima para a produção desses produtos de previsibilidade que são vendidos para quem tiver interesse em dados sobre previsão de comportamento de um certo grupo social. Isso pode ser uma agência de publicidade, um partido político, etc. Então a Google começa a projetar a sua expansão como empresa a partir da lógica de quais dados seriam interessantes para venda e criar plataformas que possam coletar esses dados. Informações que sejam interessantes para agregar usuários, que os usuários usem aquilo e ao mesmo tempo os dados possam ser utilizados. Dados sobre trânsito, sobre e-mail, sobre interesses, sobre educação, sobre serviços públicos. Ela começa a expandir os seus serviços de software e de plataformas, vai plataformizando o trânsito, por exemplo, oferece uma gama de softwares que através da inteligência artificial e dos dados que elas tomam formam uma ideia de trânsito, as ruas começam a ser alteradas a partir do uso disso. Na educação é a mesma coisa: ela oferece uma gama de softwares para as instituições de ensino, para que elas os utilizem e as empresas consigam acesso a dados relacionados a essa esfera. As empresas mais valiosas do mercado financeiro hoje têm atividades voltadas a coleta de dados e produção de plataformas. E isso se tornou uma mercadoria muito valiosa, altamente centralizada, monopolizada por um pequeno número de grandes empresas e que agora estrutura as demais esferas da sociedade, sobretudo a educação pública, o trânsito, as comunicações, várias esferas de trabalho, de sociabilidade. E isso começa a entrar no nível infraestrutural, o que torna a gente cada vez mais dependente dessas plataformas.
O problema é que a gente não sabe o que é feito com esses dados. O que sabemos do Facebook é porque alguém vazou documento interno. O que a gente na nossa pesquisa sabe sobre as universidades ou secretarias de educação que fizeram acordos com a Google, a gente teve que fazer um software para conseguir os dados. As empresas não falam sobre seu modelo de negócio. Não existem dados consolidados, os termos de uso e as políticas de privacidades são muito confusas.
Quais os marcos iniciais desse avanço das tecnologias digitais sobre a educação pública brasileira e quais as empresas que atuam por aqui?
A gente coletou dados da América do Sul especialmente sobre a educação básica no Brasil e nas universidades públicas da América do Sul. As duas únicas empresas que oferecem esses serviços são a Google e a Microsoft. Os serviços são as plataformas educacionais com infraestrutura de hardware. A Google tem a Google for Education e a Microsoft tem a Microsoft Education, que são suítes de softwares para serem utilizados na sala de aula. Você tem por exemplo o Google Classroom, no qual você coloca atividades e os alunos preenchem; você tem interação remota com os alunos, eles colocam os trabalhos; tem o Drive que é de colocar arquivos; o Google Meet, de interação remota.
Enfim, há vários aplicativos que foram transformados em aplicativos educacionais. Para você ter acesso a esses aplicativos você tem que ter uma conta Google, um email. A Microsoft é a mesma coisa. Todas as big techs, como a gente chama – a Microsoft, a Google, o Meta [que controla o Facebook e o Whatsapp], a Apple e a Amazon — todas elas têm softwares educacionais. É um ramo que agora está começando a ser disputado por essas empresas. E existe uma gama enorme de outras empresas, startups, etc, que produzem softwares educacionais, mas sem a infraestrutura. Por exemplo, tem softwares abertos como da Next Cloud, o Moodle faz softwares educacionais. Só que essas empresas não oferecem infraestrutura, que é um grande gargalo, uma parte que essas grandes empresas centralizam muito. São data centers, computadores que conseguem armazenar e processar essas informações. Grande parte das vantagens da Google, principalmente na educação superior, é a infraestrutura que elas têm: espaço de armazenamento de e-mails, de processamento de um software de edição de vídeos, que é o que o setor público não consegue mais gerir. É um ponto do avanço dessas empresas.
Em que sentido?
As universidades públicas não têm mais dinheiro para bancar estrutura de e-mail. Grande parte dessa procura pela Google e pela Microsoft se deu por uma falta de orçamento. Esses cortes que historicamente estão incidindo sobre a educação incidem diretamente na capacidade dessas instituições de gerirem parque tecnológico, comprar servidores, e-mails, HDs. É uma demanda que sempre cresce, a demanda de informações numa instituição. É um processo conhecido de avanço privado sobre o setor público. Você cria uma necessidade para o setor público através do enforcamento orçamentário. O sucateamento do setor público é a possibilidade de ele oferecer menos serviços, que começam a ser oferecidos pelo setor privado. E a educação foi fortemente atingida por isso. A grande escalada de acordos das universidades com a Google e Microsoft foi a partir de 2016, quando houve um enfraquecimento orçamentário das instituições superiores de ensino no Brasil, o que fez avançar a privatização desse serviço. Posso dar o exemplo da Unicamp [Universidade Estadual de Campinas]. O orçamento da Unicamp tem uma rubrica para um programa de manutenção do parque tecnológico da universidade, que é o dinheiro investido na infraestrutura tecnológica. A Unicamp fez acordo com a Google no começo de 2016. Um ano antes esse orçamento havia caído de R$ 3 milhões em um ano para R$ 800 mil. Então eles não tinham mais condições financeiras de manutenção. Isso aconteceu também na UFPA, que entrou em acordo com a Google no começo de 2019. Quando eles foram atrás da Google, produziram um documento que dizia que o armazenamento de e-mails da instituição estava com 95% de espaço utilizado, e o CTIC, o centro de tecnologias informacionais da UFPA, estava começando o segundo ano consecutivo sem orçamento para nada. Tudo que eles tinham era via editais. E estavam com 5% de espaço livre para armazenar os e-mails de toda a UFPA. Esse é um ponto crítico, e por isso eles foram atrás da Google principalmente para gerenciamento de e-mails no começo de 2019, que foi quando boa parte das universidades federais foram atrás da Google.
A gente viu até fins de 2018 as universidades estaduais aderindo fortemente a essas plataformas e as universidades federais não, porque elas estavam restritas por um decreto de 2013 que impedia que a administração pública federal tivesse dados em nuvem. Toda administração pública federal tinha que ter um servidor próprio ou aderir a serviços de instituições públicas federais. Então as universidades federais não podiam fazer acordo com a Google. Isso foi até dezembro de 2018, quando o [presidente Michel] Temer derrubou esse decreto. E aí em 2019 a gente vê boa parte das universidades fazendo acordo com a Google e com a Microsoft.
E na educação básica, isso se dá com a adoção do ensino remoto durante a pandemia?
Na verdade, já havia antes da pandemia a criação de uma estrutura para isso na educação básica. Boa parte dos acordos já haviam sido feitos entre as secretarias estaduais de educação e a Google para oferta de infraestrutura, principalmente com estrutura de acesso de e-mails institucionais. Na secretaria estadual de São Paulo e do Pará, por exemplo, em 2019 a Google já estava ensinando como usar os aplicativos, etc. Mas antes da pandemia era só para o aluno ter um e-mail de comunicação institucional com a secretaria escolar, com a escola e para utilização de alguns recursos se os professores quisessem. Com a pandemia há uma utilização massiva desses aplicativos. Aí a questão das relações entre educação e tecnologia começa a tomar forma, a educação baseada em dados, em princípios do vigilantismo de dados, a datificação das relações empregatícias. A secretaria do estado de São Paulo, por exemplo, obrigou os professores a utilizarem o Google Classroom porque era através dele que eles conseguiam controlar o trabalho dos professores durante a pandemia. Esse foi o grande avanço dessas empresas na pandemia, principalmente em relação à educação básica: a datificação das relações em sala de aula, que até então era um espaço não mediado por dados, não apropriável.
Entre as secretarias estaduais de educação, 50% delas tem e-mails em servidores da Google e da Microsoft; 33% em servidores da Google e 17% em servidores da Microsoft. E 50% em servidores próprios. Entre os institutos federais de educação é mais problemático. Em março de 2022, 70% dos emails dos institutos estavam armazenados em data centers na Google e 2,5% na Microsoft, sendo 27,5% em servidores próprios. São data centers que estão fora do país, sem nenhuma segurança institucional com relação ao armazenamento desses dados.
Quais os riscos disso?
O problema na educação superior é que são dados da produção científica e tecnológica do país. São e-mails que a gente manda para o orientador, para as revistas acadêmicas, comunicações de pesquisa. Esses dados estão em servidores fora do país sem nenhuma segurança jurídica. Existem leis de segurança dos Estados Unidos que permitem o acesso a esses dados, e esses dados já foram acessados. Por isso que a [presidente] Dilma [Rousseff] fez o decreto proibindo que as instituições públicas federais tivessem dados em nuvens. Na educação básica, eu acho que o problema tem a ver com as relações pedagógicas mesmo, a datificação das relações. Em termos gerais, a ampla utilização desses aplicativos, principalmente aqueles centralizados em uma mesma empresa, faz com que essa empresa tenha dados objetivos sobre a educação nacional. Você sabe quanto o aluno demorou para fazer qual lição, qual o tempo que ele demora mais para fazer, onde ele acessa a informação, que lugar ele estuda. Se você começa a coletar todos esses dados do Brasil todo você tem um diagnóstico sobre a educação pública no país, só que ele é privado. São dados privados, de propriedade da Alphabet [que controla a Google], ou da Microsoft. E que são dados aos quais as próprias secretarias estaduais de educação não têm livre acesso. Elas conseguem acessar aquilo que a empresa permite. Então você tem uma nova camada de conhecimento sobre a educação pública brasileira, que é privada. Isso é precioso para a produção de políticas públicas, para as análises educacionais do Brasil.
Especialmente em um contexto em que entidades privadas têm tido cada vez mais interlocução nos diferentes níveis de governo para a formulação de políticas públicas na educação, com movimentos como o todos pela educação, por exemplo…
Exatamente. Você tem relações entre a Google o Instituto Lemann, por exemplo, eles fazem várias coisas juntos, assim como o Instituto Natura, e outros nesse conjunto de instituições privadas. Eles fazem eventos juntos sobre educação, sobre essa nova visão sobre educação, estão produzindo políticas públicas. Isso tem a ver com toda essa visão de relação público-privada na educação que é uma das fontes do sucateamento da educação pública, uma visão neoliberal sobre o Estado.
Mas outro problema que eu vejo é a datificação das próprias relações pedagógicas, as relações entre professor-aluno, entre o aluno e o conteúdo, entre o professor e o gestor. O aprendizado do aluno, por exemplo, começa a ser medido, baseado em métricas. Quanto tempo ele demora para fazer tal coisa, quais as suas facilidades e dificuldades. As relações entre os gestores também começam a se dar por métrica e análise da dados. Isso é um paradigma pedagógico novo, imposto por uma estrutura econômica, mercadológica, um modelo de negócios que incide sobre as relações educacionais.
O grande problema de se pensar tecnologias principalmente na educação é não se pensá-las criticamente: quem está oferecendo essas tecnologias, por que elas estão entrando na sala de aula? Temos que discutir quais são os interesses por trás desse avanço das tecnologias sobre a educação. Temos que perguntar por que essas tecnologias estão sendo utilizadas. A gente perdeu isso. Existe uma ideia muito disseminada de que essa estrutura tecnológica é neutra, e que não existe alternativa. Não se pensa a centralidade disso, como isso está inserido dentro de fluxos econômicos, de trabalho, políticos. Não se pensa a questão da segurança desses dados, da dependência tecnológica. No meio da pandemia, se a Google hipoteticamente falasse não vou mais fazer negócio com o Brasil, a educação ia parar. Não havia nenhuma outra solução para isso, nenhuma estrutura. A primeira vez que o Whatsapp saiu do ar por medidas judiciais houve cidades em que a polícia não tinha mais comunicação, que ambulância não tinha mais comunicação. A única forma de comunicação era Whatsapp, porque rádio estava tudo quebrado por falta de manutenção.
Esse processo de avanço das tecnologias digitais sobre a educação tende a continuar após o retorno das aulas presenciais?
Acho que houve nessa pandemia uma valorização dos potenciais da educação a distância, e já se começou a conversar sobre o ensino híbrido, por exemplo, como solução para resolução de problemas da educação. A questão é essa visão de que as tecnologias informacionais se prestam a solucionar problemas sociais, incluído os da educação. Por exemplo, aqui no Pará a gente vai ter que lutar contra a informatização da educação da floresta, porque é um gasto levar professores para comunidades isoladas no meio da floresta amazônica. Antes da pandemia isso já era proposto. A tele-educação, educação a distância, em todos os níveis de educação, como forma de baratear a educação pública. Essa pandemia forçou a gente a entrar mais em contato, aprender a usar, a pensar rapidamente em uma estrutura de como isso poderia ser utilizado, inserir isso nas práticas pedagógicas. Esse eu acho que é um caminho bem forte. E não só na educação. É uma questão de avanço sobre todo o serviço público. Boa parte das reuniões que eu faço aqui com os professores começa a ser remota, os eventos começam a ser remotos, porque solucionam parte do problema. Você vai fazer um evento acadêmico com o preço da passagem muito cara, não tem mais orçamento para eventos em uma universidade por causa dos cortes orçamentários, e você já tem toda uma estrutura pronta, um aprendizado.
A lei geral de proteção de dados, que entrou em vigor em 2020, em meio à pandemia, trouxe algumas limitações em relação ao tratamento de dados. A LGPD trouxe algum avanço em relação à proteção de dados na educação?
A Lei foi um grande avanço, é muito importante ter uma regulação sobre a utilização de dados. Só que a meu ver ela não impede esse modelo de negócios, só coloca uma estrutura do tipo como deve ser produzida os termos de uso ou as políticas de privacidade, que leis elas devem seguir.
Agora com a LGPD, a Google teve que atualizar a sua política de privacidade. E ainda não está boa. Tem vários pontos obscuros ali que a própria lei não conseguiu apertar para conseguir as informações. Mas antes disso tinha partes da política de privacidade deles que eram em inglês. A parte sobre o que eles fazem com seus dados era em inglês, o resto em português. Aí um documento referencia outro, que referencia um outro. Tem cinco documentos que você tem que ver para saber o que eles podem fazer ou não. A [Shoshana] Zuboff fala que um dos golpes do capitalismo de vigilância é tomar para si os direitos de privacidade. Há um deslocamento da privacidade. Não é algo que possa ser requerido pelos usuários, mas é algo que é amplamente utilizado pelas empresas, porque os algoritmos são propriedade industrial, ninguém tem acesso a isso, a gente não sabe o que eles fazem com os dados. Eles estão sempre buscando brechas legais para transferir os dados para os Estados Unidos.
Então a LGPD não é suficiente para barrar o avanço da datificação da educação como um modelo de negócios. Isso cria uma roupagem institucional, mas o problema continua.
Como essa questão tem sido tratada em outros países nos quais a google tem atuado? Isso gerou alguma jurisprudência de controle que poderia servir de parâmetro para o Brasil?
Atualmente há um embate entre a União Europeia e as empresas do capitalismo de vigilância dos Estados Unidos. As atividades que a Google faz com os dados em grande parte ocorrem porque eles transmitem os dados para os Estados Unidos, e as leis de lá são mais permissivas. Esse é o grande problema que a Google está tendo na Europa, porque a Corte de Proteção de Dados europeia proibiu a transferência de dados para os Estados Unidos, justamente porque as leis de lá são incompatíveis com as leis de proteção de dados da Europa. Recentemente, a Google foi impedida de atuar sobre o setor público na Alemanha por exemplo. Isso já aconteceu na Noruega também. Também teve casos nos de estados dos Estados Unidos que processaram a Google por ela estar monitorando e-mails dos alunos, o que ela disse que não faria.
É importante reforçar que o avanço dessas empresas deve ser entendido como um problema público. Muitas vezes quando participo de eventos as pessoas pensam muito em ações individuais. Não tem como individualmente pensar em soluções para isso, porque é um problema que é imposto a coletividade através da inserção das tecnologias no serviço público. Temos que pensar maneiras de solucionar isso a partir da ação pública. Uma das coisas que a gente está propondo é a produção de infraestrutura pública para os dados públicos; que cada estado, cada universidade, tenha um centro de armazenamento e processamento de dados — data center. Um investimento em infraestrutura pensando na segurança desses dados. Outra coisa interessante que está acontecendo também é uma discussão na sociedade civil, encabeçada pelo Comitê Gestor da Internet, de uma regulação das plataformas, e aí há a possibilidade de retirar os serviços públicos do mercado de dados. É uma distorção muito grande nas relações público-privadas, como é o caso da educação: para gozar de um serviço público você necessariamente tem que participar de um mercado privado de dados. Não tem opção. Precisa-se pensar em formas regulatórias de retirar o serviço público do mercado de dados.