Qu'est-ce qu'un data scientist?



Mis à jour le Aug. 12, 2022, 7:19 a.m.

Un data scientist c'est quoi?

Un data scientist utilise les données pour comprendre et expliquer les phénomènes et ainsi aider les organisations à prendre de meilleures décisions, basées sur les données.
Travailler en tant que data scientist est intellectuellement stimulant et vous permettra de travailler à la pointe de la tech. Les data scientists sont de plus en plus courants et recherchés, car le big data joue un rôle de plus en plus important dans la prise de décision des entreprises. Voici un examen approfondi de ce qu'ils sont et font - et comment en devenir un.

Que fait un data scientist ?

Le rôle d'un data scientist est de déterminer quelles sont les bonnes questions à se poser puis d'essayer d'y répondre grâce à l'analyse de données.

Les data scientists déterminent les questions que leur équipe doit se poser et trouvent comment répondre à ces questions à l'aide de données. En effet, il faut s'assurer que l'on a réellement besoin de data science pour répondre à ce type de questions, mais aussi que l'on a les données adéquates. Si l'on a rééllement besoin d'utiliser des modèles prédictifs et de la données les data scientists développent ces modèles prédictifs pour établir des prévisions.


Au quotidien, voici ce que fait un data scientist :

 

- Se poser les bonnes questions

- Déterminer quelles données seront utiles

- Nettoyer ces données

-  Analyser ces données en créant des algos de machine learning/deep learning etc.

-  Communiquer les résultats aux autres équipes et aux cadres supérieurs

-  Utiliser des langages de données tels que Python, R, SAS ou SQL pour l'analyse des données. R et SAS sont utilisés dans les universités, la recherche et quelques vieilles entreprises pour SAS. Python est de loin le meilleur outil/langage que vous puissiez avoir.

-  Se tenir au courant des innovations dans le domaine de la data science

 

Mais ces quelques technologies ne suffisent pas. Un data scientist se doit de savoir développer, de connaître les bonnes pratiques, savoir utiliser Github, savoir intégrer son modèle à un site web par exemple, créer des APIs etc. Plus vous connaitrez de concepts, mieux ce sera. Connaître le MLOps est un gros plus.

    Quelle est la différence entre un algorithme classique vs un algorithme de machine learning?

    Qu'est ce que l'apprentissage non-supervisé?

    Qu'est ce que l'apprentissage supervisé?

    Pytorch ou Keras: quelles différences?

    OOP pour la data science

    Reseau de neurones recurrents

    Qu'est-ce qu'un data analyst?

    Qu'est-ce qu'un data engineer?

    Qu'est-ce qu'un data scientist?