Datoví vědci jsou v současnosti jednou z nejvyhledávanějších profesí, protože ve svém výzkumu dokáží získat cenné informace z velkých objemů dat. K tomu však musí umět ovládat programovací jazyky speciálně vyvinuté pro účely datové vědy. Tyto jazyky však často obsahují velké množství chyb, které pak mohou daný výzkum ve výsledku zkreslit. Odhalováním a eliminací těchto chyb se zabývá Pierre Donat-Bouillud, Ph.D. z Laboratoře výzkumu programování na Fakultě informačních technologií ČVUT v Praze (FIT ČVUT), který pro svůj výzkum obdržel grant od Evropské komise.
Pomocí programovacích jazyků je datový vědec schopen provádět prediktivní modelování v určitém oboru, jinými slovy, vytváří algoritmy schopné předpovídat budoucí vývoj. Při programování však vznikají chyby, tzv. Data bugs, které mohou zapříčinit nesprávné výpočty či výsledky výzkumu. Pierre Donat-Bouillud z Laboratoře výzkumu programování se na FIT ČVUT zabývá odhalováním těchto chyb v projektu DataBugs: Finding Bugs in Data Science Codes.
„Datová chyba je chyba nebo problém v počítačovém programu nebo systému, který může způsobit problémy, jako je ztráta dat, selhání systému nebo špatné výpočty,“ popisuje problematiku Pierre Donat-Bouillud a dodává: „Ve výzkumu se zabývám hledáním těchto chyb v kódech programovacích jazyků pro datovou vědu. Cílem výzkumu je vyvinout nové technologie programovacích jazyků na pomoc datovým vědcům a využít programovací jazyk R
k empirickému ověření jejich nových myšlenek.“
Ve svém výzkumu rozvíjí projekt, za který již obdržel mezinárodní ocenění s názvem Seal of Excellence v rámci výzvy v programu Horizont 2020. Ocenění Seal of Excellence je udělení tzv. „certifikátu kvality“ projektům, které překročily práh způsobilosti k financování, nicméně financovány nebyly. Na základě tohoto certifikátu obdržel vědec z FIT ČVUT grant, který je financován z Operačního programu Jan Amos Komenský. Ten je v gesci Ministerstva školství, mládeže a tělovýchovy ČR a je spolufinancován Evropskou unií.