10 parima andmeteadusliku raamatu ja kirjelduste loend üldistajatele

10 Parima Andmeteadusliku Raamatu Ja Kirjelduste Loend Uldistajatele



Andmeteadus on uurimisvaldkond, mis käsitleb tohutuid andmehulki kasutades teaduslikke meetodeid, protsesse, algoritme ja süsteeme, et leida nähtamatuid mustreid, ammutada tähendusrikast teavet, teha ettevõtetes äriotsuseid ja kasutada ka mitteärilistes asutustes. Ettevõtlusväliste institutsioonide hulka kuuluvad tervishoiu, mängude, pildituvastuse, soovitussüsteemide, logistika, pettuste tuvastamise (pangandus- ja finantsasutused), Interneti-otsingu, kõnetuvastuse, sihitud reklaamimise, lennuliinide planeerimise ja liitreaalsuse sektorid. Andmeteadus on tehisintellekti alamhulk. Analüüsiks kasutatavad andmed võivad pärineda paljudest erinevatest allikatest ja on esitatud erinevates vormingutes. Mõned lähteandmed võivad olla standarditud; teised ei pruugi olla standarditud.

Teisisõnu, andmete kogumiseks kasutatakse erinevaid metoodikaid (mitmus datum). Seejärel eraldatakse kogutud andmetest teadmised (väärtuslikud järeldused). Protsessi käigus tehakse pärast andmete kogumist nende (andmete) kohta uuringud, et saada uusi andmeid (tulemusi), millest probleemid lahendatakse.







Andmeteadus kui (pea)distsipliin eksisteerib ülikoolis bakalaureuse- ja magistriõppe tasemel. Kuid ainult vähesed ülikoolid maailmas pakuvad andmeteadust bakalaureuse- või magistriõppes. Bakalaureuseõppe tasemel lõpetab üliõpilane andmeteaduse kraadi. See on nagu üldotstarbeline kraad. Magistrikraadi tasemel lõpetab üliõpilane andmeteaduse kraadiõppe, mis on spetsialiseerunud andmeanalüüsile, andmetehnikale või andmeteadlaseks.



Lugejat võib üllatada ja võib-olla kahjuks ka see, et masinõpe, modelleerimine, statistika, programmeerimine ja andmebaasid on andmeteaduse bakalaureuseõppes õppimise eelduseks, hoolimata sellest, et need on omaette austatud ülikoolikursused, mida õpitakse muud erialad bakalaureuse- või magistritasemel. Vaatamata sellele, kui üliõpilane läheb ülikooli andmeteadust kraadiõppesse õppima, õpitakse kõiki neid kursusi ikkagi andmeteaduse kursuste kõrval või enne seda.



Andmeteadus bakalaureuse kraadi jaoks või selle spetsialiseerumisalad, nagu andmeanalüütika, andmetehnika või andmeteadlane, on endiselt väljatöötamisel; kuigi nad on jõudnud etappi, kus neid rakendatakse tööstuses pärast õpinguid (ülikoolis). Andmeteadus on üldiselt suhteliselt uus distsipliin.





Pidage meeles, et enne spetsialistiks saamist peaksite olema generalist. Erinevused spetsialistide programmide vahel pole veel selged. Üld- ja erialaprogrammide vahe ei ole veel selge.

Kuna andmeteadus on suhteliselt uus distsipliin, põhinevad selles dokumendis ette nähtud raamatud sisukattel, mitte pedagoogika (kui hästi raamat õpetab). Ja need on mõeldud bakalaureusekraadi (üldine) programmi jaoks. Üldiseid kursusi on erinevaid.



Nimekiri

Lisateabe saamiseks ja võimaliku krediitkaardiga ostmiseks on iga raamatu jaoks antud hüperlink. Mitte ükski raamat ei hõlma kõiki üldisi kursusi.

Andmeteaduse jaoks oluline matemaatika: arvutus, statistika, tõenäosusteooria ja lineaaralgebra

Kirjutas: Hadrien Jean

  • Kirjastaja: Hadrien Jean
  • Avaldamise kuupäev: pärast 30. septembrit 2020
  • Keel: inglise keel
  • Lehekülgede arv: üle 400

Selle raamatu sisu võib vaadelda kui andmeteaduse matemaatikakursust. Kuigi andmeteadust ise õppida ei soovita, peaks keskkoolilõpetaja, kes soovib ise õppida andmeteadust, alustama sellest raamatust.

Sisu: Arvestus; Statistika ja tõenäosus; Lineaaralgebra; skalaarid ja vektorid; maatriksid ja tensorid; ulatus, lineaarne sõltuvus ja ruumitransformatsioon; Lineaarvõrrandisüsteemid; Omavektorid ja omaväärtused; Ainsuse väärtuse lagunemine.

https://www.essentialmathfordatascience.com/

Terve mõistuse juhend andmestruktuuride ja algoritmide kohta: tõstke oma põhilisi programmeerimisoskusi / 2. väljaanne

Kirjutas: Jay Wengrow

  • Kirjastaja: Pragmatic Bookshelf
  • Avaldamise kuupäev: 15. september 2020
  • Keel: inglise keel
  • Mõõdud: 7,5 x 1,25 x 9,25 tolli
  • Lehekülgede arv: 508

See raamat käsitleb andmeteaduses kasutatavaid algoritme ja andmestruktuure. Kui eeldada, et keegi õpib pärast keskkooli lõpetamist ise andmeteadust, siis see on järgmine raamat, mida pärast eelmise matemaatikaraamatu lugemist lugeda. Näidisprogrammid on esitatud JavaScriptis, Pythonis ja Ruby's.

Sisu: Miks andmestruktuurid on olulised? Miks algoritmid on olulised? O Jah! Suur O-tähis; Koodi kiirendamine suure O-ga; Koodi optimeerimine suure O-ga ja ilma; Optimeerimine optimistlike stsenaariumide jaoks; Suur O igapäevakoodis; Põnev kiire otsing räsitabelitega; Elegantse koodi meisterdamine virnade ja järjekordadega; Rekursiivselt Recurse with Recursion; Rekursiivses keeles kirjutamise õppimine; Dünaamiline programmeerimine; Kiiruse rekursiivsed algoritmid; Sõlmepõhised andmestruktuurid; Kõigi asjade kiirendamine binaarsete otsingupuudega; Hoidke oma prioriteedid kuhjade abil sirged; Proovida ei tee haiget; Kõikide ühendamine graafikutega; Ruumipiirangutega tegelemine; Koodi optimeerimise tehnikad

Nutikam andmeteadus: ettevõtte tasemel andmete ja tehisintellekti projektidega edu saavutamine / 1 St Redigeerimine

Kirjutasid: Neal Fishman, Cole Stryker ja Grady Booch

  • Kirjastaja: Wiley
  • Avaldamise kuupäev: 14. aprill 2020
  • Keel: inglise keel
  • Lehekülgede arv: 286

Sisu: AI-redelil ronimine; I osa raamimine: tehisintellekti kasutavate organisatsioonide kaalutlused; II osa: kaalutlused andmete ja tehisintellektiga töötamisel; Tagasivaade analüüsile: rohkem kui üks haamer; Vaata tulevikku analüüsi kohta: kõik ei saa olla nael; Operatiivdistsipliinide käsitlemine tehisintellekti redelil; Teie andmete kasutamise maksimeerimine: väärtuspõhine; Andmete väärtustamine statistilise analüüsiga ja sisuka juurdepääsu võimaldamine; Pikaajaline ehitamine; Teekonna lõpp: AI AI jaoks.

Masinõpe: tõenäosuslik vaatenurk (adaptiivse arvutuse ja masinõppe seeria) illustreeritud väljaanne

Kirjutas: Kevin P. Murphy

  • Kirjastaja: The MIT Press
  • Avaldamise kuupäev: 24. august 2012
  • Keel: inglise keel
  • Mõõdud: 8,25 x 1,79 x 9,27 tolli
  • Lehekülgede arv: 1104

See raamat on hea algajatele. Jällegi, nagu kõik ülejäänud käesolevas dokumendis ette nähtud raamatud, ei hõlma see raamat kõike, mis on vajalik üldise programmi jaoks, mis on kahjuks endiselt lõpetamata (ka erialaprogrammid on endiselt lõpetamata). Tüüpiline algaja siin on matemaatika ja informaatika lõpetanud keskkoolilõpetaja.

Sisu: Sissejuhatus (Masinõpe: mis ja miks?, Juhendajata õpe, Mõned masinõppe põhimõisted); Tõenäosus; Generatiivsed mudelid diskreetsete andmete jaoks; Gaussi mudelid; Bayesi statistika; Sagedased statistika; Lineaarne regressioon; Logistiline regressioon; Üldised lineaarsed mudelid ja eksponentsiaalne perekond; Suunatud graafilised mudelid (Bayesi võrgud); Segumudelid ja EM-algoritm; Varjatud lineaarsed mudelid; hõredad lineaarsed mudelid; tuumad; Gaussi protsessid; Adaptiivsed baasfunktsiooni mudelid; Markovi ja varjatud Markovi mudelid; Riigiruumi mudelid; Suunamata graafilised mudelid (Markovi juhuslikud väljad); Täpne järeldus graafiliste mudelite jaoks; Variatsiooniline järeldus; Rohkem variatsioonilisi järeldusi; Monte Carlo järeldus; Markovi ahela Monte Carlo (MCMC) järeldus; Klasterdamine; Graafilise mudeli struktuuri õppimine; Varjatud muutujate mudelid diskreetsete andmete jaoks; Sügav õppimine.

Andmeteadus ettevõtetele: mida peate teadma andmekaevandamise ja andmeanalüütilise mõtlemise kohta / 1. väljaanne

Kirjutasid: Tom Fawcett ja Foster Provost

  • Kirjastaja: O'Reilly Media
  • Avaldamise kuupäev: 17. september 2013
  • Keel: inglise keel
  • Mõõdud: 7 x 0,9 x 9,19 tolli
  • Lehekülgede arv: 413

Sisu: Andmeanalüütiline mõtlemine; Äriprobleemid ja andmeteaduslikud lahendused; Sissejuhatus ennustavasse modelleerimisse: korrelatsioonist juhendatud segmenteerimiseni; Mudeli sobitamine andmetega; Liigne paigaldamine ja selle vältimine; sarnasus, naabrid ja klastrid; Otsuste analüütiline mõtlemine I: milline on hea mudel?; Mudeli jõudluse visualiseerimine; Tõendid ja tõenäosused; Teksti esitamine ja kaevandamine; Otsuste analüütiline mõtlemine II: analüütilise inseneri poole; muud andmeteaduslikud ülesanded ja tehnikad; Andmeteadus ja äristrateegia; Järeldus.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktiline statistika andmeteadlastele: 50+ olulist kontseptsiooni R-i ja Pythoni kasutamisel / 2. väljaanne

Kirjutasid: Peter Bruce, Andrew Bruce ja Peter Gedeck

  • Kirjastaja: O'Reilly Media
  • Avaldamise kuupäev: 2. juuni 2020
  • Keel: inglise keel
  • Mõõdud: 7 x 0,9 x 9,1 tolli
  • Lehekülgede arv: 368

Sisu: uurimuslik andmete analüüs, andmete ja valimite jaotus, statistilised katsed ja olulisuse testimine, regressioon ja ennustamine, klassifitseerimine, statistiline masinõpe, järelevalveta õpe.

Raamat Miks: uus põhjuse ja tagajärje teadus

Stsenaristid: Judea Pearl, Dana Mackenzie

  • Kirjastaja: Basic Book
  • Avaldamise kuupäev: 15. mai 2018
  • Keel: inglise keel
  • Mõõdud: 6,3 x 1,4 x 9,4 tolli
  • Lehekülgede arv: 432

Kui paljud andmeteaduse raamatud kasutavad illustreerimiseks puhast ärivaldkonda, siis see raamat kasutab illustreerimiseks meditsiinitööstust ja muid teadusharusid.

Sisu: Sissejuhatus: Mind üle andmete; Põhjusliku seose redel; Buccaneersist merisigadeni: põhjusliku järelduse teke; Tõenditest põhjusteni: Reverend Bayes kohtub hr Holmesiga; Segadus ja dekonfounding: või, Slaying the Lurking Variable; Suitsu täis debatt: õhu puhastamine; Paradokse külluses!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafaktuaalid: kaevandusmaailmad, mis oleksid võinud olla; Vahendus: mehhanismi otsimine; Suurandmed, tehisintellekt ja suured küsimused.

Looge karjääri andmeteaduses

Kirjutasid: Emily Robinson ja Jacqueline Nolis

  • Kirjastaja: Manning
  • Avaldamise kuupäev: 24. märts 2020
  • Keel: inglise keel
  • Mõõdud: 7,38 x 0,8 x 9,25 tolli
  • Lehekülgede arv: 354

Sisu: Andmeteadusega alustamine; Andmeteaduse töö leidmine; Andmeteadusesse sisseelamine; Kasvad oma andmeteaduse rollis.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2. väljaanne

Kirjutas: Lillian Pierson

  • Kirjastaja: For Dummies
  • Avaldamise kuupäev: 6. märts 2017
  • Keel: inglise keel
  • Mõõdud: 7,3 x 1 x 9 tolli
  • Lehekülgede arv: 384

See raamat eeldab, et lugejal on matemaatika ja programmeerimise eelteadmised juba olemas.

Sisu:  Andmeteaduse ümber pööramine; Andmetehnoloogia torujuhtmete ja infrastruktuuri uurimine; Andmepõhise ülevaate rakendamine ettevõtluses ja tööstuses; Masinõpe: andmetest oma masinaga õppimine; Matemaatika, tõenäosuse ja statistiline modelleerimine; Klastrite kasutamine andmete jaotamiseks; Modelleerimine eksemplaridega; Asjade Interneti-seadmeid kasutavate mudelite ehitamine; Andmete visualiseerimise kujundamise põhimõtete järgimine; D3.js kasutamine andmete visualiseerimiseks; Veebipõhised rakendused visualiseerimise kujundamiseks; Armatuurlaua kujundamise parimate tavade uurimine; Ruumiandmetest kaartide tegemine; Pythoni kasutamine andmeteaduse jaoks; Andmeteaduse jaoks avatud lähtekoodiga R kasutamine; SQL-i kasutamine andmeteaduses; Andmeteaduse tegemine Exceli ja Knimega; Andmeteadus ajakirjanduses: viie W (ja H) naelutamine; Keskkonnaandmete teadusesse süvenemine; Andmeteadus e-kaubanduse kasvu edendamiseks; Andmeteaduse kasutamine kuritegeliku tegevuse kirjeldamiseks ja ennustamiseks; Avaandmete kümme fenomenaalset ressurssi; Kümme tasuta andmeteaduse tööriista ja rakendust.

Massiivsete andmekogumite kaevandamine / 3 rd Redigeerimine

Stsenaristid: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Kirjastaja: Cambridge University Press
  • Avaldamise kuupäev: 13. veebruar 2020
  • Keel: inglise keel
  • Mõõdud: 7 x 1 x 9,75 tolli
  • Lehekülgede arv: 565

See raamat eeldab ka, et lugejal on juba matemaatika ja programmeerimise eelnõutud teadmised.

Sisu: Andmekaeve; MapReduce ja uus tarkvarastack; MapReduce'i kasutavad algoritmid; Sarnaste esemete leidmine; Andmevoogude kaevandamine; Linkide analüüs; Sagedased esemekomplektid; Klasterdamine; Reklaam veebis; Soovitussüsteemid; Sotsiaalvõrgustiku graafikute kaevandamine; Mõõtmete vähendamine; Suuremahuline masinõpe.

Järeldus

Erinevused spetsialistide programmide vahel pole veel selged. Samuti ei ole veel selged erinevused üld- ja erialaprogrammide vahel. Pärast antud raamatute nimekirja lugemist saab lugeja aga paremini hinnata andmeanalüütiku, andmeinseneri ja andmeteadlase erirolle ning seejärel edasi liikuda.