Inteligência artificial mensura proporção de homens e mulheres na literatura

Inteligência artificial mensura proporção de homens e mulheres na literatura

Ao longo dos últimos séculos, a literatura tornou-se menos igualitária e após os anos 1960 essa diferença começou a diminuir

The Economist

17 Março 2018 | 16h00

Em Sociedade dos Poetas Mortos (1989), John Keating, professor em um colégio interno dos anos 1950, interpretado por Robin Williams, desenha um gráfico, cuja forma é ditada por um ensaio fictício chamado Compreendendo a Poesia. O eixo horizontal mede a qualidade técnica de um poema, o eixo vertical mostra sua importância e a combinação dos dois determina sua grandeza. Depois de deixar que seus alunos desenhem esse gráfico para Lord Byron e William Shakespeare, Keating declara que o ensaio é um “excremento” e ordena que eles os rasguem de suas antologias de poesia. “Esta é uma batalha, uma guerra, e as baixas podem ser seus corações e almas”, resmunga. Há “exércitos de acadêmicos que avançam medindo poesia”, sem consideração pela paixão, beleza ou romance.

+++Como a inteligência artificial está revolucionando a música e a arte

Sem dúvida, Keating teria ficado assustado ao ler A Transformação dos Sexos na Ficção em Língua Inglesa, artigo publicado no Journal of Cultural Analytics. Os autores – Ted Underwood e Sabrina Lee da Universidade de Illinois, e David Bamman, da Universidade da Califórnia – treinaram uma série de modelos de aprendizagem mecânica em uma ampla coleção de 104 mil obras de ficção escritas entre 1700 e 2010. O banco de dados, que os acadêmicos compilaram a partir da Biblioteca Digital HathiTrust e do Chicago Novel Corpus, é enorme, mas não completo. Contém quase todas as novelas clássicas, mas apenas cerca de metade dos livros listados na revista Publishers Weekly. Os autores, porém, acreditam que essa seja uma representação razoável do mercado geral de ficção, uma vez que a participação histórica de mulheres como autoras é semelhante à da Publishers Weekly. Os algoritmos permitiram que eles explorassem uma série de questões ligadas ao sexo dos autores.

+++Tecnologia encontra arte em ópera 3D de Michael van der Aa

Um modelo identifica o sexo de um autor e descobre que a parcela de livros escritos por mulheres caiu de cerca de metade no início do século 19 para menos de um quarto na década de 1960, seguido de uma recuperação de cerca de 40% hoje. Um segundo modelo identifica o sexo dos personagens através de seus nomes e pronomes, com mais de 90% de precisão, e mostra uma tendência semelhante: a parcela de narrativa dada a mulheres ficcionais diminuiu ao longo de 150 anos, antes de se recuperar ligeiramente. Um terceiro modelo tenta determinar o sexo de um personagem com base apenas na linguagem usada nas descrições, ações e diálogo. Essas previsões acertaram 75% das vezes em 1800, mas apenas 65% em 2000, sugerindo que as mulheres e homens ficcionais estão se comportando de maneiras menos estereotipadas.

Keating teria considerado essa pesquisa bobagem. Ele ensinava que o propósito da leitura é sentir, “saborear palavras e linguagem”: medicina, direito, negócios e engenharia são atividades nobres que nos mantêm vivos, mas a literatura desperta as emoções que fazem com que viver valha a pena. No entanto, em um ensaio para o The Atlantic em 2014, Kevin Dettmar, professor de inglês no Pomona College, criticou o anti-intelectualismo do filme. Ele argumentou que defender a literatura puramente por seu valor sentimental encoraja a crença de que “as ciências humanas são fáceis, uma opção suave e não treinam pensadores”.

Ambos estão em parte certos. Uma ótima literatura pode mobilizar os leitores de uma maneira que poucos outros assuntos acadêmicos podem. Também pode, quando examinada criticamente, estimular o raciocínio, a empatia e o debate. Os neurologistas têm enfrentado dificuldades para provar que a leitura de ficção realmente melhora essas funções, mas eles mostraram que examinar um texto ativa as partes relevantes do cérebro. Para aqueles que acreditam que estudar literatura criticamente vale a pena, as lições que podem ser captadas a partir de grandes dados e aprendizado automático são valiosas.

Tome-se como exemplo o sexo dos autores. Esta deveria ser uma das questões mais básicas para os estudiosos literários responderem: a ficção tornou-se mais ou menos dominada pelos homens? Antes do advento das ciências humanas digitais, um campo que aplica ciência da computação às artes, a resposta só pode ser subjetiva ou baseada em pequenas amostras. A Transformação do Sexo fornece uma resposta objetiva que surpreenderia muitas pessoas e deveria provocar mais pesquisas. A recuperação pós-1960 das autoras, por exemplo, poderia ter muitas causas. Lee observa que ela se segue ao surgimento da novela de bolso e coincide com uma proliferação de edições de romances.

Os leitores também estarão intrigados com gráficos que mostram como a linguagem usada para descrever homens e mulheres mudou. “Coração”, “mente” e “espíritos” já foram fortemente femininos, mas agora se tornaram neutros, enquanto a “casa” mudou de proprietários de terras para mulheres domésticas. No entanto, Bamman argumenta que o produto mais promissor dessa pesquisa é elementar: a capacidade de uma máquina de identificar personagens literários. E. M. Forster, escritor britânico, descreveu as pessoas em uma história como “massas de palavras”, compostas simplesmente de descrições, ações e diálogos. Agora é possível para um algoritmo ingerir um texto, identificar os assuntos de cada palavra usando o contexto e dividindo-os nessas massas. De fato, uma das técnicas usadas no documento é conhecida como o “modelo de saco-de-palavras".

Underwood observa que os algoritmos estão longe de serem perfeitos. Embora eles possam ser usados para examinar livros individuais, eles também cometem erros, especialmente quando um narrador na primeira pessoa está estruturando a história. Em uma amostra mais ampla, no entanto, eles podem ser distribuídos com mais confiança. Um artigo publicado por Bamman em 2013 foi capaz de identificar estereótipos de caráter de 42 mil resumos de filmes da Wikipédia, que agruparam Batman com Jason Bourne e o Coringa com Dracula. Uma continuação da análise em 2014 confirmou várias teorias literárias sobre as semelhanças entre personagens nas novelas de Charles Dickens e Jane Austen, entre outros escritores.

O último estudo também foi capaz de separar a voz do autor – ou seja, os maneirismos que tornam cada escritor único – daqueles dos personagens, que têm suas próprias peculiaridades. Bamman explica que a identificação de indivíduos também pode ajudar os algoritmos a compreender a trama, uma vez que uma mudança repentina no pessoal geralmente indica uma mudança de cenário. A capacidade de isolar esses elementos formais de escrita e compará-los em um vasto corpo de trabalho também está sendo aproveitada por outros estudiosos. A última edição do New Oxford Shakespeare afirmou que 17 das 44 peças do bardo foram produzidas de forma colaborativa, com base em uma análise de como seus contemporâneos usavam “palavras funcionais” como “e” ou “com”.

Essa identificação de autor tem sido utilizada desde a década de 1950, quando dois estatísticos (sem antecedentes na história) provaram que 12 ensaios de The Federalist Papers, reivindicados por Alexander Hamilton e James Madison, eram muito mais semelhantes ao estilo de Madison. Olhar para as palavras funcionais (como “enquanto” versus “ao mesmo tempo”, ou “enquanto” versus “entre”) era mais definitivo do que examinar as ideias nos ensaios. Mas computadores e corporações digitais tornam isso muito mais rápido hoje em dia: Ben Blatt adotou essas técnicas para muitos experimentos inteligentes em Nabokov’s Favorite Word is Mauve (A Palavra Favorita de Nabokov é Malva, em tradução livre), seu livro de 2017.

A inteligência artificial ainda está longe de ser capaz de escrever de forma coerente novos argumentos, como descobrimos quando recentemente tentamos automatizar um artigo para nossa seção de Ciência e Tecnologia. Quando se trata de metáforas e alusões, os humanos sempre acreditam ter a vantagem. Mas seria loucura ignorar a ajuda que o aprendizado da máquina pode oferecer aos que buscam respostas empíricas às questões literárias. Tais técnicas podem enriquecer a compreensão dos leitores sobre os livros que eles amam, sem prejudicar seu entusiasmo. Para emprestar outra frase de Keating, enquanto ele incentiva seus alunos a ficar em suas mesas: “Devemos constantemente olhar as coisas de uma maneira diferente”. Tradução de Claudia Bozzo 

Mais conteúdo sobre:
literatura inteligência artificial

Encontrou algum erro? Entre em contato

O Estadão deixou de dar suporte ao Internet Explorer 9 ou anterior. Clique aqui e saiba mais.