L’open Coffee Club a organisé Jeudi 2 Juin une conférence débat sur le Machine Learning appliqué aux projets startup.

Et tout ça dans un lieu inspirant, puisque nous avons été reçus dans les locaux de CRITEO, leader mondial du marketing digital et innovateur dans le domaine des algorithmes de Machine Learning (ou apprentissage par la machine).

eiver a été invité en tant que Startup utilisatrice de procédés de machine learning dans le domaine de l’assistance à la conduite et a partagé le micro avec 3 experts, Christel BELTRAN, Partner Executive chez IBM et Watson Ambassador, et dont SaveCode/eiver est partenaire, Alexis BISMUTH, Docteur en Statistique, Mathématicien-chercheur dans le domaine de l’intelligence artificielle et Franck BARDOL, Arts et Métiers, Data Scientist, Fondateur du Machine Learning Group.

Démystification

Une conférence animée par Eric DUBOIS et un échange très orienté “démystification” à destination des créateurs de projets technologiques, web ou mobiles, devant mettre en oeuvre des mécanismes d’auto apprentissage ou de corrections d’informations basées sur l’acquisition de données en masse (Big data). Nous avons pu exposer notre expérience du machine learning en présentant notre démarche d’acquisition et de traitement de la donnée d’usage automobile, basée sur la capture de la vitesse instantanée du véhicule et la translation de cette donnée en 3 “états instantanés”  : accélération, vitesse constante, décélération. Ce “découpage” de la donnée de trajet nous ayant amené à requalifier toute portion de trajet en “patterns” ou “canevas” de 3 types : Coaster, Cruiser ou Liner, qui, combinés entre eux, composent ensuite toute type de trajet automobile. C’est à cette première étape de transformation des données de base (les Data) souvent non structurées et non analysées, que nous appliquons notre premier calcul de qualification de trajet, qui constitue un 1er scoring de la qualité du trajet. Moins nous enregistrons d’accélérations et de décélérations, combinées à la vitesse moyenne de la portion de trajet et la distance parcourue, plus la “qualité” du trajet sera valorisée. Le Barême est simple. Sur une échelle de pondération 0 à 2, un trajet de qualité moyenne sera “scoré” à 1, un trajet comportant trop d’accélérations/décélérations au km sera scoré inférieur à 1 et les trajets comportant peu d’écarts de vitesse sera scoré supérieur à 1.

Des Mécanismes de compensation

Et c’est là qu’arrive le hic : un conducteur dit “urbain” ou “coaster” risque d’être désavantagé sur son score car il est contraint par l’infrastructure sur des trajets de petite distance de vitesse moyenne basse et de forte sollicitations en écarts de vitesse. Signalons ici que cette discrimination ne concerne que les populations professionnelles dans le cadre de leur mission. eiver n’a pas vocation à encourager les trajets en voiture en ville, si l’individu a le choix de son mode de transport.  Mais pour répondre aux demandes de nos clients entreprise, qui mettent en oeuvre nos solutions dans le cadre de la gestion de leur flotte de véhicules, nous mettons en oeuvre des mécanismes de Machine Learning qui compensent un trajet contraint et rétablissent régulièrement l’équilibre sur des populations de conducteurs professionnels.

Le Machine Learning appliqué à l’obtention de la vérité.

Un second algorithme, appliqué à tout conducteur cette fois, permet d’affiner les valeurs de consommation carburant et d’émission de CO2, en fonction des résultats déjà enregistrés par la communauté. Avec près de 45 000 téléchargements de l’application eiver en Europe et 4 Millions de km parcourus à ce jour par nos conducteurs, sur tout type et marque de véhicule légers, eiver est capable d’affiner les valeurs de consommation réelle et les applique en fonction du score de conduite évoqué plus haut.

La mise en oeuvre de mécanismes de machine learning est aujourd’hui facilitée par plusieurs facteurs : la fluiditié des transferts de données de masse, la multiplication des capteurs embarqués et des smartphones, et surtout la capacité de calcul de ceux ci. Mais également l’accès à des offres et des services dans le cloud de type BlueMix ou Watson pour évoquer les solutions IBM que nous utilisons et qui bénéficient d’une excellente scalabilité, évolutivité et robustesse, et surtout sécurité des données.