Alapvető feladata, hogy a heterogén (strukturált és nem strukturált), jellemzően nagyméretű (big data) adathalmazok megfelelő szűrése és tisztítása után mesterséges intelligencia alapú modellek és statisztikai algoritmusok alapján olyan információkat nyerjen ki, amelyek szimpla adatelemzéssel nem érhetők el.
Mai világunkban a szoftverek rengeteg adatot gyűjtenek, amiket azonban feldolgozni, tisztítani, értelmezni, konvertálni kell. Az adatokat az egyik rendszerből át kell juttatni a másik rendszerbe. Az üzlet számára a strukturálatlan, nagy tömegű adathalmazból értelmezhető információkat kell kinyerni, melyekre aztán üzleti döntéseket lehet alapozni. A Data Scientist dolga elsődlegesen az, hogy ebben technológiai támogatást is adjon. Idejét az adatok vizsgálatával, átalakításával, kiegészítésével, szűrésével, csoportosításával és tisztításával tölti. Szoros kapcsolatban van az üzleti területtel, proaktív módon nyújt segítséget az adatok feldolgozásában. Eszközkészlete főleg a Python programozási nyelvre épül, valamint az adatfeldolgozást végző matematikai és statisztikai könyvtárakra.
Különösen jól ismeri a mesterséges intelligencia, gépi tanulás és deep learning algoritmusokat.
Ezek felhasználásának főbb területei az önvezető autók, robotika, orvosi diagnosztika, chatbotok, stb., de AI (Artificial Intelligence) algoritmusokat használnak pl. egy képen valamilyen formák, alakzatok felismerésére is. Ismeri a neurális hálózatokat, melyek a biológiai neurális hálókat modellezik, erősen egyszerűsített módon utánozva az emberi gondolkodást.
A munkakör rendkívül összetett, és a főterülethez tartozó legtöbb egyéb munkakör tapasztalatát együttesen igényli, illetve azokon is túlmutat.
Ahhoz, hogy hozzászólhass el kell fogadnod az ide kapcsolódó sütik használatát (Disqus). Ezt megteheted az adatvédelem oldalon (ahol további információkat találsz), vagy erre a gombra kattintva.