Skip to content

Nesgos no machine learning

O gran problema de aprenderlles as máquinas a falaren como humanos é xustamente que aprenden a falar como humanos. Cos seus mesmos nesgos, estereotipos e prexuízos agregados.

Por exemplo, ao pasar aquí dunha lingua sen marca de xénero a unha con, como aprenderlle que para <PAI> si pode basearse en que sempre o ve en masculino pero para <XEFE> non?

Para a máquina, que aprende apenas relacións entre letras sen entender o que son nin comprender o contexto no que existen, é todo o mesmo, e a mesma lóxica aplica. Ela non sabe que xeneralizacións son lícitas e cales non, así que a miúdo cómpre entrarlles nas tripas a desactivar cada unha por separado. Unha lea.

Estes problemas veñen das tecnoloxías actuais de aprendizaxe máquina por estadística, que traballan con big data: isto é, canto máis información lles deas, mellor traballan. Isto significa que tentar balancear unha característica na información provista (por exemplo, tantos textos que falen de xefes homes como de xefes mulleres), pode limitar os resultados da máquina ao ter menos datos en xeral cos que traballar.

Tamén pode introducir novos nesgos ao suceder que todos os textos sobre mulleres xefas veñan dun determinado demográfico (idade, país, cultura, raza…) ou contexto (sanitario, doméstico, cosmético…). Porque, volvendo ao do comezo, os nesgos do mundo están aí, e é complicado aprenderlle a unha máquina sobre o mundo sen que aprenda sobre o mundo.

Efectivamente hai formas de mitigar estes problemas, como optar por outras técnicas (funcionan peor), construír os teus propios datos (distorsiona a efectividade real), editorializar a mostra (moi, moi custoso), etc. Hai que ponderalo todo e equilibrar as prioridades.

O que quero dicir é que nada é tan sinxelo como parece nin tan puramente malicioso. Google preferiría que a súa máquina non tivese esos nesgos e podo asegurarvos que están a investigar moito para compensalos. Así que, en xeral, os problemas non veñen de escuras conspiracións, senón de que o camiño á perfección está cheo de fochancas e é máis longo do que estamos acostumados a pensar.

Dito isto, superaprol de seguir presionando para vixilar constantemente que os nesgos que xa non teñen por que existir desaparezan. Ao final, «indignación pública» tamén é un factor a considerar nese xogo de prioridades. 🤖


Publicado orixinalmente en Twitter.