Techninis vaizdas, kaip nusikaltėliai naudojasi AI

Mašinų mokymasis yra viena įdomiausių naujųjų technologijų savybių, naudojamų šiandien. Tačiau neabejotinai jis yra ir prieštaringai vertinamas. Šiuo metu šis ginčas kyla ne dėl ultra intelektualių robotų, dramatiškai užvaldančių žmoniją, perspektyvos; vietoj to, todėl, kad tokią galingą technologiją nusikaltėliai gali naudoti taip pat neigiamai, kaip ir teigiamą ketinimą turintys asmenys. Šiame kūrinyje norėčiau ištirti tamsesnę pusę: kaip nusikaltėliai neteisėtai naudojasi AI.

Prieš tai, kai kompiuteriai turėjo galimybę išspręsti euristines problemas, daugelis apsaugos sistemų buvo sukurtos laikantis principo, kad tai nesikeis. Tiesiog nebuvo apsvarstyta mintis, kad kompiuteris gali atspėti slaptažodį, perskaityti grafinį „Captcha“ ar sužinoti, kaip elgiasi tikras eismas. Dabar mus supa saugumas, kurį AI paseno.

„Captchas“ ir atvaizdų klasifikacija

Yra daug, daug kartų, kai sistema turės patvirtinti, kad vartotojas iš tikrųjų yra žmogus. Taip yra todėl, kad visas funkcijas, kurias kompiuteris siūlo žmogui, kompiuterio programa taip pat gali panaudoti ar imituoti. Jei bandysite prisijungti prie „Facebook“ daugiau nei tris kartus, pastebėsite, kad „Facebook“ prašo patvirtinti, kad esate žmogus, o ne kompiuterio programa, bandanti įvesti milijonus slaptažodžių per sekundę. „Facebook“ ir daugybė paslaugų tai daro naudojant „captcha“ metodą:

Ilgus metus šios sėkmingai atskyrė programas nuo žmonių, kol AI atėjo. Dabar gali būti naudojami pagrindiniai konvoliuciniai neuroniniai tinklai, kur naudojamas didžiulis „captcha“ vaizdų rinkinys. Kiekviena „captcha“ turi nurodytą tikslą, o išmokę „convnet“, ateityje gali parengti siūlomus „captchas“. Tai yra daugiau nereikšmingas pavyzdys, kai reikalingi visi pagrindiniai neuroninių tinklų principai. Dabar, kai captchas gali būti apeinamas, brutalios jėgos išpuoliai yra daug labiau įmanomi. Galbūt teko susidurti ir su „pasirinkti visus paveikslėlius, kuriuose yra autobusų“ tipo captcha, kurią AI taip pat lengva apeiti. Mes visi žinome, koks yra puikus objektų aptikimas - „Google“, net ir kaip integruota į jų paieškos sistemą, kaip labai svarbią ir sėkmingą funkciją.

Slaptažodžiai su generatyviniais konkurencijos tinklais

Tik nedaugelis iš mūsų turi tokius slaptažodžius: 5f2 # V0 ”P? Oz3

Daugiau mūsų slaptažodžių atrodo taip: „Kronenbourg1664“

Kiti mes netgi turime tokius slaptažodžius: slaptažodis

Vis tiek yra atvejų, kai tie, kurie seka mano pirmąjį pavyzdį, yra labai saugūs nuo to, kad žmogus ar GTX 1080 GPU atspėja slaptažodžius. Tačiau visi kiti yra pažeidžiami. Taigi, kaip galima atspėti šiuos slaptažodžius? Paprasčiausiai, mes galėtume naudoti žodyną ir pritaikyti kiekvieną žodį slaptažodžio įvedimui. Mums gali pasisekti su labai maža dalimi mūsų bandymų - dėl tų žmonių, kurie seka mano paskutinį pavyzdį. Jei esate vienas iš tų žmonių, aš visiškai tikiu, kad pakeisite slaptažodį iki šio straipsnio pabaigos.

Dabar pažvelkime į modernesnį ir netgi grėsmingesnį požiūrį (aišku, naudojant AI). Vietoj žodyno, neuroniniai tinklai naudojami didžiuliam tikėtinų slaptažodžių sąrašui sudaryti. Autentiškumo patvirtinimo formai naudoti naudojamas šis sąrašas. Paimta iš „PassGAN: giluminio mokymosi požiūrio į slaptažodžių paieškas“, štai kaip galima sudaryti šį sąrašą:

Jei esate susipažinęs su neuroniniais tinklais (kurie, turėčiau paminėti, yra gana svarbūs keliose pastraipose), vis tiek tai gali atrodyti neįprasta. Užuot tiesiog numatę elementą pagal įvestį, mes mokomės iš duomenų, o tada mokome generatorių pateikti kelis papildomus pavyzdžius. Tai vadinama generatyviu prieštaringu tinklu, kuriame naudojami du neuroniniai tinklai; vieną, kad būtų galima atskirti teisingus ir neteisingus įvestis, tada tą, kuris išmoksta iš to, kad atsitiktiniai triukšmai galėtų pateikti naujus teisingus duomenis.

Pirma, mes naudojame esamą duomenų rinkinį, kuriame yra tikrieji žmonių slaptažodžiai, galbūt dėl ​​istorinio slaptažodžio nutekėjimo, kuris nuo to laiko buvo prieinamas. Jie kartu parodys, kaip atrodo žmogaus slaptažodžiai (kelios didžiosios raidės, data, atsitiktinis skaičius, vardas ir kt.).

Antra, mes naudojame triukšmo generatorių (G), kuris (iš pradžių) išves atsitiktinius duomenis. Šios dvi galimos įvestys (suklastoti ir tikri slaptažodžiai) yra įvestys į neuroninį tinklą (arba D diskriminaciją). Tikslai yra suprojektuoti kaip paprasti dvejetainiai išėjimai. Tai reiškia, kad treniruotės metu neuroniniam tinklui nurodoma, ar įvestas slaptažodis yra netikras, ar tikras. Kiekvieno tiekimo srauto metu pagaminta išvesties vertė yra palyginama su tiksline verte (tiesa), o po to vėl skleidžiama, kad pakoreguotų svorio vertes pagal paklaidos ribą. Generatorius tai taip pat paveikia, nes atsitiktinis įvesties triukšmas pradės optimizuotis arčiau slaptažodžio išvesties.

Pakeitus generatorių, bet koks kitas į tinklą įkeltas triukšmas sukels eilutes, kurios atrodo kaip slaptažodžiai. Taigi, jei paliktume ją veikti kelioms valandoms, galėtume sudaryti didžiulį intelektualiai sudarytų slaptažodžių sąrašą.

Sukčiavimas

Sukčiavimas yra labai paplitusi įsilaužimo forma. Ar kada nors gavote el. Laišką, kuris atrodo visai netinkamas, tačiau teigia, kad yra jūsų bankas, telefono tarnyba ar socialinės žiniasklaidos platforma? Bet kuris naujokas programuotojas, žinantis šiek tiek HTML kartu su vos paliestu užpakaliniu kodu, pavyzdžiui, PHP, gali tai atsisakyti. Tai apima el. Laiško, kuris vizualiai sukurtas atrodyti, tarkime, „Facebook“, ir naudoti panašią oficialią kalbą, siuntimą. Teigiama, kad turite ką nors atnaujinti, peržiūrėti ar pakeisti, ir paprašykite prisijungimo duomenų, kad tai padarytumėte. Viskas, ką įvesite, bus nusiųstas į nusikaltėlio serverį. Bet kokiu atveju, kaip AI į tai įsitraukia?

Mašinų mokymasis gali pagerinti sukčiavimą, apžiūrint bet kurią platformą, išmokant jų išvaizdą ir kalbą, tada masiškai sukuriant suklastotus el. Laiškus remiantis tam tikrais stebėjimais, kurie automatiškai išsiunčiami dideliu mastu. Tačiau tai nėra vienintelis būdas. Piratai taip pat gali naudoti tuos pačius anksčiau aprašytus principus atspėti slaptažodžius, atspėti el. Pašto adresus. Gali būti pagaminta milijonai el. Pašto adresų, o tai padidina tikimybę rasti techniškai netikrus žmones.

Daugelyje el. Pašto paslaugų, būtent „Gmail“, įdiegtos pažangios sistemos sukčiavimo elektroniniams laiškams aptikti, tačiau mašininis mokymasis gali būti naudojamas kuriant el. Laiškus, kurių šios sistemos neaptinka. Mokymo rinkinys būtų el. Laiškų rinkinys, kai kurie iš jų nepavyko pasiekti vartotojo dėl sukčiavimo apsimetant, o kiti - sėkmingai. nervų tinklas gali sužinoti, kaip aptinkamas sukčiavimas, suprantant, kurie buvo sugauti ir kurie nebuvo. Ateityje el. Laiškai gali būti generuojami remiantis taisyklėmis, kurių neišvengia sukčiavimo aptikimas, žr. Čia nuorodą.

Išvada

Pirma, tai tik trys atvejai. Nerimą kelia tai, kad kitose srityse yra daug daugiau, pavyzdžiui, apgaulinga reklama, netikro srauto imitavimas ir kita. Vis dėlto man patinka galvoti, kad AI naudojimas teisiniame pasaulyje labai nusveria nusikalstamą pasaulį. Ironiška, bet PG naudojama nusikalstamoms veikoms nustatyti įvairiais nuostabiais būdais - pradedant gatvių policija ir baigiant sukčiavimu internete. Norėdami baigti, pakeiskite slaptažodį, jei generatyvinis konkurencijos tinklas galėtų jį atspėti; nesekite jokių jums atsiųstų nuorodų, nebent du kartus patikrinote siuntėjo tapatybę; ir galiausiai, nenaudokite nė vieno iš šių būdų pažeisdami įstatymus!

- - - - - - - - - - - - - - - - - - -

Perskaitykite daugiau duomenų mokslo straipsnių „OpenDataScience.com“ tinklalapyje, įskaitant vadovus ir vadovus nuo pradedančiųjų iki aukštesniųjų lygių! Prenumeruokite mūsų savaitinį informacinį biuletenį čia ir kiekvieną ketvirtadienį gaukite naujausias naujienas.