Cyril de Catheu

Cyril de Catheu

Ingénieur ML

Salut, moi c’est Cyril.

Je suis ingénieur en traitement de données et apprentissage automatique chez AB Tasty. Informaticien spécialisé en TAL de Centrale Nantes, je suis basé à Paris.
Mes sujets d’intérêts en TAL sont la modélisation de language, l’étude de similarité sémantique, la désambiguïsation lexicale et la régularisation de modèles par génération de données synthétiques.
En matière d’ingénierie, je m’intéresse surtout aux service de décisions automatiques, à la création de platforme de bandits contextuels, à l’apprentissage incrémental et aux flux de données distribués temps réels.

Ce blog est né d’une certaine lassitude de la recherche en TAL, sérieusement biaisée par la prédominance des deux langues les plus parlées dans le monde que sont l’anglais et le mandarin. Ce qui est un problème fondamental pour une discipline qui étudie des langues est aussi un problème plus général pour l’informatique francophone: il n’existe quasiment aucune resource en français sur les méthodes d’ingénierie de données et d’apprentissage automatique modernes. C’est tout à fait flagrant pour les logiciels open source et les applications “monde réel” de nouvelles technologies. J’espère par ce blog aider à déveloper les communautés ML et NLP francophones, sinon tout au moins apporter un peu de contenu technique en francais sur le web. Oui il n’y a pas d’article pour le moment. J’ai du sortir ça en vitesse pour l’article sur le COVID-19.

En dehors de l’informatique, je suis coureur de fond au Stade Français. Ce blog n’abordera jamais le sujet de l’athlétisme, mais vous pouvez me trouver sur Strava ou écouter mon entraineur sur Spotify ou Apple podcast.

Une question, un projet, envie de discuter ?

Mentions légales

### Responsable de traitement Le responsable de traitement du site [catheu.tech][catheu] est: Cyril de Catheu 19 rue Tiphaine 75015 Paris, FRANCE Tel: zero six 84 82 99 08 Mail: google mail -> cdecatheu ### Hébergement Le site est hébergé par la société GitHub, Inc. GitHub, Inc. 88 Colin P Kelly Jr Street San Francisco, CA 94107 United States La société GitHub, Inc. est joignable à l’adresse legal@support.github.com. ### Mentions relatives à l’utilisation des cookies Un cookie est un petit fichier informatique qui permet d’analyser le comportement des usagers lors de la visite d’un site internet ou de l’utilisation d’un logiciel ou d’une application mobile. catheu.tech utilise Google Analytics. Il s’agit d’un service d’analyse Web fourni par: Google Inc. 1600 Amphitheatre Parkway Mountain View, CA 94043 USA Grâce à la certification du bouclier de protection des données UE-États-Unis [Privacy Shield][privacy-us], Google garantit qu’il suit les réglementations de l’UE en matière de protection des données lors du traitement des données aux États-Unis. Le service Google Analytics est utilisé pour analyser l’utilisation du site catheu.tech. L’intérêt légitime réside dans l’analyse, l’optimisation et le fonctionnement du site [catheu.tech][catheu]. Google propose un module complémentaire de désactivation à l'adresse suivante: [https://tools.google.com/dlpage/gaoptout?hl=en][no-ga]. Ce module complémentaire peut être installé sur les navigateurs les plus populaires et vous offre un contrôle supplémentaire sur les données que Google recueille lorsque vous visitez [catheu.tech][catheu].