Meseriile viitorului - un subiect foarte prezent atât în preocupările părinților, cât și în cele ale persoanelor active deja în câmpul muncii - explorează constant potențialul unor zone precum robotica, Inteligența Artificială, agricultura responsabilă, schimbările climatice sau explorarea spațială, încercând să anticipeze nevoi și așteptări care vor contura tendințe sau provocări ale societății în decadele următoare. Tinerii români, elevi, studenți sau absolvenți deopotrivă, reușesc performanțe remarcabile la competiții internaționale de idei și soluții pentru probleme cu impact global, devenind modele inspiraționale pentru cum ne putem implica activ pentru schimbări reale și de durată pentru omenire.
Un astfel de exemplu ni-l oferă studenții români câștigători ai WiDS Datathon ++ University Program 2024, Equity in Healthcare. În cadrul competiției globale, care a reunit echipe de la 70 de universități din 23 de țări, cei doi studenți ai Universității Tehnice din Cluj-Napoca (echipa TUCN_AI_ErrorExorcists, locul 1 global și național) și cei patru studenți ai Academiei de Studii Economice din București (echipa ASE_Data Mining_Fantasticians, locul 3 global și locul 2 național) au oferit soluții premiate, cu aplicabilitate în domeniul oncologic.
“Competiții precum WIDS Datathon sunt un catalizator pentru descoperirea și aprofundarea de către tinerii studenți, și nu numai, a tehnicilor specifice Științei Datelor. Totodată, aceste competiții evidențiază modul concret în care astfel de tehnici pot contribui la rezolvarea unor probleme reale, cu impact semnificativ în societate. Temele abordate în edițiile recente WiDS au acoperit o gama variată de domenii, de la analiza consumului de energie, la diagnoza ADHD, fiecare cu provocări specifice, care impun construirea creativă a unor soluții particulare pornind de la tehnicile generale.
Un alt impact pozitiv și deloc neglijabil al inițiativelor precum WiDS, și în mod particular inițiativa Think Tank 360 de popularizare a WiDS în România, este construirea unei comunități cu preocupări comune. Apartenența la o astfel de comunitate activă nu doar ca sporește motivația individuală, dar contribuie și la creșterea calității soluțiilor dezvoltate, prin colaborare și schimb de idei”, a declarat Anca Mărginean, Conferențiar Universitar și coordonatoarea echipei Universității Tehnice din Cluj-Napoca.
Ioana Bîrlan, membră a echipei ASE_Data Mining_Fantasticians din cadrul ASE București, despre principalele provocări întâmpinate în preprocesarea și curățarea setului de date oncologice utilizat în competiție: “Una dintre cele mai mari provocări a fost să adaptăm tehnici de preprocesare la un context atât de complex și sensibil cum este cel oncologic. A trebuit să înțelegem nu doar datele, ci și implicațiile lor reale. Un exemplu a fost prelucrarea variabilelor textuale din descrierea diagnosticului – nu doar aplicând NLP (Natural Language Processing) clasic, ci și testând diverse moduri de a păstra sensul clinic în vectorizarea textului. O altă provocare a fost detectarea și reducerea multicoliniarității, care afecta stabilitatea modelelor. Am experimentat și cu modele spațiale, testând analize separate pe fiecare stat, tocmai pentru a înțelege mai bine disparitățile regionale. Toate aceste decizii tehnice ne-au ajutat să obținem o performanță ridicată a modelului și, poate mai important, o mai bună înțelegere a factorilor care influențează accesul la tratament în mod inechitabil. Cred că partea de preprocesare ne-a apropiat cel mai mult de realitatea din spatele cifrelor.”
Factorii sau variabilelele din setul de date care au avut cel mai mare impact asupra predicțiilor privind echitatea în sănătate au fost, în opinia Anei-Maria Oprea, membră a echipei ASE_Data Mining_Fantasticians “tratamentul administrat prima dată în cazul cancerului metastatic, descrierea diagnosticului de cancer mamar și anul în care a fost pus diagnosticul de cancer mamar. Acești factori au fost cei mai influenți în modelul utilizat, ceea ce sugerează că momentul în care este identificată boala și modul în care începe tratamentul pot juca un rol esențial în înțelegerea diferențelor legate de accesul la îngrijiri medicale. Factorii care au avut cel mai mare impact asupra predicțiilor privind echitatea în sănătate nu se limitează doar la aspecte medicale, ci includ și variabile demografice și socio-economice. Printre acestea, domiciliul, vârsta și tipul de abonament medical, s-au dovedit a fi elemente relevante. Aceste constatări evidențiază modul în care inegalitățile sociale, culturale și economice pot afecta accesul la îngrijirea medicală și pot contribui la decalaje semnificative în momentul în care pacienții beneficiază efectiv de tratament.”
Gianina-Maria Petrașcu, echipa ASE_Data Mining_Fantasticians, despre interpretarea rezultatelor modelului în contextul echității în sănătate și a implicațiilor practice ale acestora: „Atât modelul nostru final, cât și analiza exploratorie a datelor ne-au oferit o imagine cuprinzătoare a inegalităților din sistemul medical. Am observat că durata până la primirea tratamentului poate fi influențată de zona geografică, grupul etnic din care face parte pacientul sau situația materială a acestuia. Astfel că implicațiile practice ale acestor rezultate sunt multidimensionale și vizează atât politici publice, cât și practici medicale. Este necesară o abordare mai echitabilă în distribuirea resurselor și în accesul la tratamente, pentru a asigura faptul că pacienții din grupurile defavorizate beneficiază de aceleași șanse de tratament ca cei din grupurile privilegiate.”
Dacă ar putea alege tema unei viitoare competiții WiDS Datathon, care să adreseze o problemă de impact global cu ajutorul analizei datelor, Bianca Conțolencu, de la echipa ASE_Data Mining_Fantasticians, este de părere că “În prezent la nivel global ne confruntăm cu foarte mult fake-news, ceea ce face extrem de dificil pentru utilizatori să distingă între ceea ce este corect și real și ceea ce este fals sau manipulat. Această problemă afectează nu doar încrederea publicului în sursele de informație, dar poate avea și consecințe grave asupra proceselor politice, economice și sociale. După părerea mea, o temă interesantă pentru o viitoare competiție WiDS Datathon ar putea fi analiza și combaterea fenomenului de „fake news”. Un set de date format din știri și articole-fantomă clasificate drept “real” sau “fals”. M-aș gândi că analiza datelor ar putea include dezvoltarea unor modele de învățare automată care să ajute la identificarea știrilor false, prin analiza limbajului, a surselor, a stilului de scriere și a altor trăsături ale textului. De asemenea, ar putea fi utilizate tehnici de procesare a limbajului natural (NLP) pentru a detecta nu doar falsele afirmații, ci și manipulările subtile ale informațiilor, precum distorsionarea contextului sau crearea de senzaționalism. Astfel de soluții ar putea contribui la dezvoltarea unor sisteme de verificare a știrilor, care să ajute publicul larg să acceseze informații verificate și credibile.”
Referitor la faptul că Women in Data Science (WiDS) joacă un rol important în promovarea diversității în domeniul științei datelor și implicarea mai mare a femeilor în acest domeniu poate contribui la inovații și soluții mai echitabile, inclusiv în contextul sănătății, Andreea Maria Onaci, membră a echipei TUCN_AI_ErrorExorcists din cadrul Universității Tehnice din Cluj-Napoca, susține că “Implicarea mai mare a femeilor în domeniul științei datelor poate aduce inovații esențiale și soluții mai echitabile, în special în sănătate. Femeile pot contribui cu perspective unice, ce ajută la dezvoltarea unor modele și algoritmi mai sensibili la diversitatea populației, incluzând grupuri subreprezentate. Aceste perspective pot duce la soluții mai personalizate și eficiente, care reflectă nevoile variate ale diferitelor segmente ale societății. De asemenea, implicarea femeilor poate promova un acces mai echitabil la tehnologie și resurse, ajutând la reducerea inegalităților în domeniul sănătății. Femeile din diverse colțuri ale lumii pot adresa provocări legate de accesul la tehnologii moderne, asigurându-se că soluțiile dezvoltate beneficiază întreaga populație, nu doar grupuri privilegiate. Astfel, diversitatea în știința datelor contribuie la crearea unor soluții de sănătate mai incluzive și mai bine adaptate la realitățile fiecărei comunități.”
În contextul în care profesia de Data Scientist este tot mai importantă la nivel global, Petruț Paul Betuel, din echipa TUCN_AI_ErrorExorcists, consideră că “În România, dezvoltarea acestui domeniu este necesară pentru a stimula inovația și a răspunde cerințelor pieței. Ar trebui să se investească în educație de calitate, în formare continuă și în parteneriate între universități și industrie. În plus, oferirea de oportunități de practică ar ajuta tinerii să se integreze mai ușor pe piața muncii.
De asemenea, HUB-ul Român de Inteligență Artificială (HRIA) va oferi un cadru excelent pentru tinerii care vor să se implice în acest domeniu, facilitând accesul la proiecte reale și oportunități de învățare.”
„Participarea la competiția WIDS Datathon a evidențiat complexitatea și sensibilitatea prelucrării datelor oncologice, dar și potențialul real al Științei Datelor de a sprijini decizii informate în domeniul sănătății. O provocare majoră a constat în înțelegerea datelor medicale, adaptarea tehnicilor de preprocesare a textului la un context medical, gestionarea datelor incomplete dar și integrarea variabilelor demografice și socio-economice în analiză. Analiza exploratorie a datelor și modele de machine learning utilizate au demonstrat discrepanțele semnificative între regiuni, grupuri etnice și tipuri de asigurare medicală. Aceste constatări subliniază necesitatea unei abordări mai echitabile în alocarea resurselor și în asigurarea accesului la tratamente, astfel încât pacienții din grupurile defavorizate să beneficieze de aceleași oportunități de îngrijire ca și cei din grupurile privilegiate.
Implicarea activă a femeilor în această competiție a demonstrat capacitatea acestora de a inova și de a contribui cu soluții relevante în fața unor probleme globale. Prezența femeilor în domeniile științei, tehnologiei, ingineriei și cercetării nu mai reprezintă o excepție, ci devine tot mai mult o normalitate.” a concluzionat Cristina Boboc, Profesor Universitar Doctor și coordonatoarea echipei Academiei de Studii Economice din București.
******************************************************************
Inițiativa WiDS a a fost lansată la Universitatea Stanford în 2015.
Evenimentele WiDS România au fost lansate în 2021 și reunesc femei remarcabile din domeniile științelor datelor, inteligenței artificiale, cercetării și inovației, care reprezintă instituții de prestigiu din țară și din străinătate. În 2024, programele WiDS au ajuns la peste 150.000 de participanți la nivel global din 100 de țări, peste 1000 de ambasadori în 77 de țări și 200 de evenimente la nivel mondial.
Obiectivele WiDS România, promovate de Asociația Think Tank 360:
- Educarea tuturor participanților, indiferent de gen, cu privire la cele mai recente cercetări, tehnologii de vârf, provocări și tendințe viitoare.
- Sprijinirea femeilor din domeniul științei datelor pentru a-și promova munca și încurajarea lor pentru a continua să urmărească oportunități legate de știința datelor și inteligența artificială.
- Informarea participanților cu privire la domeniile captivante de cercetare și aplicare în știința datelor, evidențiind modele și demonstrând diversitatea oportunităților din acest domeniu.