Uusimmat

Kuvia luovien generatiivisten tekoälyjen koulutusdatasta löytyi lapsipornoa

Kuva: @ Pixabay

23.12.2023 20:05 Muropaketin toimitus

Stanford Internet Observatory (SIO) tutki tekoälyjen käyttämää koulutusdataa.

SIOn tutkija David Thiel kertoi vastikään vähemmän mieltä ylentäviä uutisia koulutusdatan sisällöstä. SIO oli aiemmin kuullut verkossa kiertäviä huhuja, että suuresta, avoimesta LAION-5B-koulutusdatasta löytyisi lapsipornoa. Väite osoittautui paikkansapitäväksi, ja Thiel huomasi myös itse, että dark webissä levisi generatiivisella tekoälyllä tuotettuja lapsipornokuvia.

Thiel kertoi huolistaan Ars Technicalle. Thielin mukaan ”lasten hyväksikäyttöä koskevan materiaalin sisällyttäminen tekoälymallien koulutusdataan opettaa työkaluja yhdistämään lapset laittomaan seksuaaliseen toimintaan, ja käyttää tunnettuja lasten hyväksikäyttökuvia uuden, mahdollisesti realistisen lasten hyväksikäyttösisällön tuottamiseen.”

LAION-5B-koulutusdataa on käytetty generatiivisen tekoälyn tarpeisiin kuvien tuottamisessa. Tekoälydataa on käyttänyt ainakin StableDiffusion 1.5. Lapsiporno on päätynyt koulutusdataan useista verkon lähteistä, joihin kuuluvat myös suositut sosiaalisen median sivustot.

Thielin raportin jälkeen LAION aikoi poistaa koulutusdatansa verkosta väliaikaisesti. LAION kertoi heillä olevan käytössä ”nollatoleranssi” laitonta sisältöä kohtaan.

Muropaketin uusimmat