Roboti na zisťovanie pornografie nemusia byť schopní rozpoznať rozdiel medzi grotom a umením
Filtre obsahu sú často prvou, poslednou a jedinou líniou obrany medzi nevinnými používateľmi a kopírovaním množstva sexuálne explicitných obrázkov na poslednom mieste, ktoré to očakávate.
Niekedy sa naozaj zaobídete bez neočakávaného pohľadu na pornografiu a toľko webov používa algoritmy na potlačenie grotu skôr, ako ho uvidíte. Bohužiaľ sa zdá, že niektorí z týchto robotov blokujúcich pornografiu nefungujú tak, ako by ste dúfali, a statočne zachránia niekoľkých používateľov pred veľkým umením, ako aj nad vecami pre dospelých.
Čo je tu na vine? Strojové učenie.
Vysvetlil Bezpečnosť Panda, vysvetlili, že najlepším spôsobom, ako naučiť robota blokujúceho pornografiu, je ukázať mu celú hromadu pornografických obrázkov. Je to podobné ako fungovanie antivírusového a antimalvérového systému a podobne ako v prípade týchto nástrojov existujú aj falošné poplachy.
Súvisiace: Najlepšie počítačové hry
Ide o to, že je veľký rozdiel medzi fotografiou niekoho v spodnom prádle (to by bolo zlé) a niekoho v bikinách na pláži (všeobecne ok) a ani nezačínajte s tým, ako podobné niečo ako dojčenie (opäť ok) sa môže javiť u hromady vecí, ktoré sú určite zlé.
Nedávno sme to videli niekoľkokrát. Spoločnosť Panda Security spomína Tumblrov sporný pornofilm, ktorý sa aktivoval v decembri a ktorý označil celú kopu nevinných obrázkov za sexuálne explicitné.
„Inteligentné systémy postavené pomocou strojového učenia sú nakoniec chybné, pretože ľudia, ktorí ich programujú, sú nedokážeme presne určiť, kde je hranica medzi „ok“ a „porno“ prekročená, “tvrdí blog Panda Security príspevok. "Algoritmy môžu byť schopné zablokovať 99,9% pochybného obsahu, ale 0,1%, ktoré zostanú, budú vždy problémom."
„Tieto nuansy sú pre detekciu antimalvéru irelevantné, pretože súbor môže byť iba v jednom z dvoch stavov:„ vírus “alebo„ nie vírus “. Obrázky majú naopak tri stavy: „porno“, „nie porno“ a „možno porno“. „Možno porno“ je miesto, kde strojové učenie môže (a aj nemusí) zlyhať. To je tiež miesto, kde sa v najbližších rokoch uskutoční väčšina investícií do automatizovaných systémov. “