Tuohan se on yksi ratkaisumalli mitä tähän on tarjottu, tosin ilman varsinaista tekoälyä. Eli että joka härvelissä olisi tietokanta, missä olisi 'tunnistetiedot' osapuilleen kaikesta lapsipornosta mitä on ikinä viranomaisten toimesta nähty. Ei tietenkään niitä varsinaisia kuvia, vaan jonkinlainen "sarjanumero", mitä sitten verrataan ihan kaikkeen mitä kapulastasi tuuttaat ulos.
Noh, kuten tiedetään, niin koneiden kuvientunnistus on vähän niin ja näin (mm. tyyliin reCaptcha haluaa että merkkaat liikennevaloista varoittavan liikennemerkin etkä niitä varsinaisia valoja), jolloin johonkin virastoon pärähtää hälytys että nyt keletappi postaa laitonta materiaalia, vaikka todellisuudessa kuvassa olikin karvaton kissanpentu. Tämä syö resursseja ihan oikeasti toimivalta työltä ja pahimmillaan saat kaivella keskustelulogeja puhelimesta siinäkohtaa kun karhuryhmä on tullut saranapuolelta sisään keskellä yötä.
Ja sitten se toinen ongelma, joka on mielestäni ihan hemmetin paljon isompi: Jos kuvatunkaltainen ennakkosensuuri (tekoälyllä tai ilman) otetaan käyttöön, niin rikolliset kaivelevat sitten sen tunnistusmekaniikan laitteista ulos ja testaavat omat kuva-arkistonsa sitä vastaan, jolloin "turvattomat" kuvat saadaan helposti seulottua ja järjestelmän tunnistamatta jättämät kuvat voi laittaa darknettiin myyntiin. Tämän jälkeen järjestelmän tuntemat kuvat syötetään jollekin toiselle tekoälylle, joka muokkaa kuvia niin pitkään että käyttötarkoitus säilyy, mutta tunnistusjärjestelmän lippu ei enää heilu.
Ja lopputuloksena tavan sukankuluttajien tietoturvaa on heikennetty, viranomaisresursseja tuhlataan siihen että katselevat kuvia possuista, pienikokoisista aikuisista ja tiessunmistä ja noista jonkinlainen osa aiheuttaa kevyesti sanottuna harmaita hiuksia joillekin onnekkaille, jotka päätyvät ihmisseulasta huolimatta tiukempiin tutkimuksiin. Samalla ne oikeat rikolliset osaavat piiloutua entistä paremmin, käyttää parempia salausmekanismeja ja saavat ihan kirjaimellisesti työkalut valvonnan parempaan välttämiseen.
Kaupan päälle tietysti vielä vähän kalteva pinta, joka sanoo että jos lapsipornoa voidaan ennakkosensuroida niin olemassaolevaa järjestelmää on helpompi laajentaa muihinkin epämukavuuksiin kuin luoda isovelijärjestelmä tyhjästä.
Others have already mentioned about the challenges on the software/management side, but you also need to take into consideration hardware failures, power outages, network outages, acceptable downtime and so on. So, even if you could technically shoehorn all of that into a raspberry pi and run it on a windowsill, and I suppose it would run pretty well, you'll risk losing all of the data if someone spills some coffee on the thing.
So, if you really insist doing this on your own hardware and maintenance (and want to do it properly), you'd be looking (at least):
And likely a ton of other stuff I can't think of right now. So, 10k for hardware, two physical locations and maintenance personnel available all the time. Or you can buy a website hosting (VPS even if you like) for few bucks a month and email service for a 10/month (give or take) and have the services running, backed up and taken care of for far longer than your own hardware lifetime is for a lot cheaper than that hardware alone.