Mis on ristvalideerimine AWS-is?

Mis On Ristvalideerimine Aws Is



Masinõpet kasutatakse erinevate mudelite rakendamiseks antud andmetele, et ennustada tulevikku nende koolitamiseks kasutatavate andmete põhjal. Tehisintellekti sisaldavad erinevad masinõppemudelid, nagu logistiline regressioon, K-lähimad naabrid jne. Et leida, millist mudelit tuleks vastavalt andmekogumile ja stsenaariumidele rakendada, saab teha ristvalideerimise teel.

See juhend selgitab ristvalideerimist ja selle toimimist AWS-i teenuse abil.

Mis on ristvalideerimine?

Ristvalideerimine võimaldab arendajatel võrrelda erinevaid masinõppemudeleid ja saada aimu nende tööst päriselus. See aitab kasutajal välja selgitada, milline masinõppe (ML) või süvaõppe (DL) mudel töötab konkreetse andmete või stsenaariumi puhul paremini. On olukordi, kus ühe andmestiku jaoks saab kasutada mitut mudelit. Siin kasutavad arendajad ristvalideerimist, et saada optimeeritud tulemuste saamiseks sobiv mudel:









Kuidas ristvalideerimine töötab?

Andmestiku ML-mudelite kontrollimiseks peab kasutaja hindama mudeli omadusi, mida nimetatakse algoritmi treenimiseks. Teine asi, mida kontrollida, on mudeli hindamine, et teha kindlaks, kui hästi see toimis, ja seda nimetatakse mudeli testimiseks. Ei ole hea mõte testida mudelit kõigi andmetega, kuid me kasutame 75% andmetest koolituseks ja 25% testimiseks, et saada paremaid tulemusi. Ristvalideerimine testib iga 25% andmetest, et kontrollida, milline plokk toimib kõige paremini:







Mis on Amazon SageMaker?

AWS-i ristvalideerimist saab teha Amazon SageMakeri teenuse abil, kuna see on loodud masinõppemudelite loomiseks, koolitamiseks ja juurutamiseks. See aitab andmeteadlastel ja arendajatel valmistada andmeid ette tõhusate ML- või DL-mudelite loomiseks, koondades eesmärgipärased võimalused. Need võimalused on kasulikud optimeeritud ja täpsete mudelite koostamiseks, mida saab aja jooksul täiustada.



Amazon SageMakeri omadused

Amazon SageMaker on hallatav teenus ja see ei nõua ML-keskkondade haldamist. See vajab ML-mudelite koolitamiseks ja ehitamiseks palju andmeid, et see oleks andmete kogumiseks hästi ühendatud Amazon S3 või Amazon Redshift teenustega. Toorandmete saamine võib olla keeruline, mistõttu on mudelite koostamiseks vaja ka funktsioone. Seejärel kasutage andmeid mudelite koolitamiseks ja seejärel testige neid, kasutades iga 25% andmetest, et saada paremaid tulemusi/ennustusi.

See kõik puudutab AWS-i ristvalideerimist.

Järeldus

Ristvalideerimine on andmete optimaalse masinõppe või süvaõppe mudeli hankimise protsess, et saada paremaid tulemusi. See testib iga 25% andmeosa kohta, et mõista, milline plokk annab maksimaalse väljundi, muutes selle sobivaks sobivaks mudeliks. AWS pakub teenust SageMaker, et teostada ristvalideerimist ja luua pilves masinõppemudeleid. Selles juhendis on selgitatud ristvalideerimise protsessi ja selle toimimist AWS-is.