Machine learning al CSUC

Machine learning al CSUC

El machine learning, o aprenentatge automàtic, és una branca de la intel·ligència artificial que s’encarrega de l’anàlisi i el desenvolupament d’algoritmes que permetin una millora del comportament de la màquina en un àmbit concret a través de l’anàlisi de dades. Els potencials objectius d’aquests algoritmes són d’allò més diversos.

Cada dia utilitzem serveis que funcionen gràcies a algoritmes d’aquest tipus, i probablement sense saber-ho. Per exemple, els portals de compra en línia o els de continguts audiovisuals i musicals en streaming fan servir algoritmes que analitzen els productes comprats, la música escoltada o les pel·lícules vistes i generen associacions per tal de mostrar-nos productes que s’adeqüin a la nostra tendència de consum.

N’existeixen d’altres que estan especialitzats en analitzar imatges i identificar-hi de manera autònoma objectes, animals o persones concretes. S’utilitzen per a millorar la cerca d’imatges en buscadors o, en el món de la medicina, per al diagnòstic de malalties i/o lesions a través d’imatges generades per tècniques mèdiques diverses, com ara les ressonàncies magnètiques, radiografies o ecografies.

Machine learning al CSUC

Al CSUC som conscients de la importància que té el machine learning ara i de la que tindrà en un futur proper i per això volem facilitar la feina als usuaris que vulguin desenvolupar projectes d’aquests tipus amb programari i maquinari especialitzat.

Pel que fa al programari, al CSUC disposem d’entorns virtuals que facilita el gestor de paquets CONDA. Aquests entorns permeten instal·lar diferents paquets de manera totalment independent entre entorns, evitant així problemes de compatibilitat entre diferents versions.

Per defecte, hem creat una sèrie d’entorns virtuals bàsics, que ja estan preparats per ser utilitzats en diferents àmbits, com ara la química quàntica, la bioinformàtica o el machine learning, i que estan equipats amb els paquets que són punta de llança:

  1. Tensorflow, creat per Google, és el paquet que més activitat va generar durant l’any 2018, ja sigui en forma de projectes o de documentació.
  2. Keras és el segon paquet més utilitzat i és especialment ideal per als usuaris que es volen iniciar en el món del machine learning.
  3. PyTorch és el tercer paquet més popular. Està recolzat per Facebook i està augmentant ràpidament la seva adopció.

A més, com a paquets complementaris també disposem de: Pandas, NumPy o Seaborn, entre d’altres.

Finalment, els usuaris més exigents o amb requisits específics també poden crear entorns personalitzats i instal·lar-hi els paquets que necessitin per al seu projecte.

Com a complement al programari, tenim disponibles quatre nodes ideals per a tasques de machine learning i de processament de dades en general.

Cadascun d’aquesta nodes està equipat amb 48 processadors Intel® Xeon®Platinum 8168 CPU a 2.7 GHz, 192GB de memòria RAM i 2 GPU Nvidia P100 amb 12GB RAM. Aquestes unitats de processament gràfic són capaces de millorar el rendiment dels càlculs i reduir de manera substancial el temps d’espera de resultats.

D’altra banda, si el projecte requereix d’una gran quantitat de memòria també està disponible el Bull Sequana X800 (canigo), màquina de memòria compartida, amb 384 nuclis i 9TB de memòria RAM.

Si esteu interessats en utilitzar les nostres eines de machine learning o voleu més informació podeu accedir al portal d’HPC del CSUC.

Comparteix