Accéder au contenu principal

Sélection

AI

 L'Intelligence Artificielle L'intelligence artificielle est l'intelligence dont font preuve les machines, par opposition à l'intelligence naturelle dont font preuve les animaux, y compris les êtres humains. Les principaux manuels d'IA définissent le domaine comme l'étude des "agents intelligents" : tout système qui perçoit son environnement et entreprend des actions qui maximisent ses chances d'atteindre ses objectifs. Certains comptes rendus populaires utilisent le terme "intelligence artificielle" pour décrire les machines qui imitent les fonctions "cognitives" que les humains associent à l'esprit humain, comme "l'apprentissage" et "la résolution de problèmes", mais cette définition est rejetée par les principaux chercheurs en IA. Les applications de l'IA comprennent les moteurs de recherche avancés sur le web, les systèmes de recommandation, la compréhension de la parole humaine, les voitures ...

Data Science

Data Science

La science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de données bruyantes, structurées et non structurées, et appliquer des connaissances et des idées exploitables à partir de données dans un large éventail de domaines d'application. La science des données est liée à l'exploration des données, à l'apprentissage automatique et au big data. La science des données est un "concept visant à unifier les statistiques, l'analyse des données, l'informatique et leurs méthodes connexes" afin de "comprendre et d'analyser des phénomènes réels" à l'aide de données. Elle utilise des techniques et des théories tirées de nombreux domaines dans le contexte des mathématiques, des statistiques, de l'informatique, des sciences de l'information et de la connaissance des domaines. Cependant, la science des données est différente de l'informatique et des sciences de l'information. Jim Gray, lauréat du prix Turing, a imaginé la science des données comme un "quatrième paradigme" de la science et a affirmé que "tout ce qui touche à la science change en raison de l'impact des technologies de l'information" et du déluge de données. Un data scientist est une personne qui crée du code de programmation et le combine avec des connaissances statistiques pour créer des idées à partir de données. La science des données est un domaine interdisciplinaire axé sur l'extraction de connaissances à partir d'ensembles de données, qui sont généralement volumineux, et sur l'application des connaissances et des informations exploitables à partir des données pour résoudre des problèmes dans un large éventail de domaines d'application. Ce domaine englobe la préparation des données en vue de leur analyse, la formulation de problèmes de science des données, l'analyse des données, l'élaboration de solutions fondées sur les données et la présentation des résultats pour éclairer les décisions de haut niveau dans un large éventail de domaines d'application. À ce titre, elle fait appel à des compétences en informatique, statistiques, sciences de l'information, mathématiques, visualisation de l'information, sonification des données, intégration des données, conception graphique, systèmes complexes, communication et commerce. Le statisticien Nathan Yau, s'inspirant de Ben Fry, relie également la science des données à l'interaction homme-machine : les utilisateurs doivent pouvoir contrôler et explorer les données de manière intuitive. 


En 2015, l'American Statistical Association a identifié la gestion des bases de données, les statistiques et l'apprentissage automatique, et les systèmes distribués et parallèles comme les trois communautés professionnelles fondatrices émergentes. Relation avec les statistiques De nombreux statisticiens, dont Nate Silver, ont affirmé que la science des données n'est pas un nouveau domaine, mais plutôt un autre nom pour les statistiques. D'autres affirment que la science des données se distingue des statistiques parce qu'elle se concentre sur les problèmes et les techniques propres aux données numériques. Vasant Dhar écrit que les statistiques mettent l'accent sur les données quantitatives et la description. En revanche, la science des données traite des données quantitatives et qualitatives et met l'accent sur la prédiction et l'action. 



Andrew Gelman de l'université de Columbia a décrit les statistiques comme une partie non essentielle de la science des données. David Donoho, professeur à Stanford, écrit que la science des données ne se distingue pas des statistiques par la taille des ensembles de données ou l'utilisation de l'informatique, et que de nombreux programmes d'études supérieures présentent de manière trompeuse leur formation en analyse et en statistique comme l'essence même d'un programme de science des données. Il décrit la science des données comme un domaine appliqué issu de la statistique traditionnelle. En 1985, lors d'une conférence donnée à l'Académie chinoise des sciences à Pékin, C.F. Jeff Wu a utilisé pour la première fois le terme "science des données" comme nom alternatif pour les statistiques. Plus tard, les participants à un symposium de statistiques organisé en 1992 à l'Université de Montpellier IIs ont reconnu l'émergence d'une nouvelle discipline axée sur les données d'origines et de formes diverses, combinant les concepts et principes établis de la statistique et de l'analyse des données avec l'informatique. L'expression "science des données" remonte à 1974, lorsque Peter Naur l'a proposée comme nom alternatif pour l'informatique. 



En 1996, la Fédération internationale des sociétés de classification a été la première conférence à faire de la science des données un thème spécifique. En 1998, Hayashi Chikio a fait valoir que la science des données était un nouveau concept interdisciplinaire comportant trois aspects : la conception, la collecte et l'analyse des données. Dans un article publié en 2001, il a plaidé en faveur d'une expansion des statistiques au-delà de la théorie, vers des domaines techniques ; parce que cela changerait considérablement le domaine, il fallait lui donner un nouveau nom. Le titre professionnel de "data scientist" a été attribué à DJ Patil et Jeff Hammerbacher en 2008. Bien qu'il ait été utilisé par le National Science Board dans son rapport de 2005 intitulé "Long-Lived Digital Data Collections : Enabling Research and Education in the 21st Century", il faisait référence de manière générale à tout rôle clé dans la gestion d'une collection de données numériques.



Commentaires

Enregistrer un commentaire

Articles les plus consultés