Ràdio Verdú i 3w2 IA Labs exploren el potencial de DeepSeek

Ràdio Verdú28/01/2025

1 5 minuts de lectura

A Ràdio Verdú treballem de manera constant per mantenir-nos a l’avantguarda de la innovació i la tecnologia. En aquesta línia, col·laborem amb 3w2 IA Labs per dur a terme proves, prototips d’aplicació i assajos creatius amb nous sistemes d’intel·ligència artificial.

Verdú. 28.01.2025.

Recentment, hem centrat els nostres esforços en DeepSeek, una plataforma que ha irromput amb força com a alternativa xinesa al conegut assistent ChatGPT d’OpenAI i altres models avançats. Tot i l’enrenou mediàtic i els titulars virals sobre el suposat col·lapse d’OpenAI i Nvidia a causa de les capacitats de DeepSeek, cal analitzar amb rigor aquest nou sistema abans de treure conclusions precipitades.

Contràriament al que molts influencers i veus mediàtiques han afirmat, DeepSeek no és una creació sobtada o improvisada. Aquest sistema compta amb un recorregut significatiu en el camp de la IA. De fet, abans del seu llançament massiu, des de Ràdio Verdú ja havíem provat altres solucions com Qwen, un model que vam deixar en pausa a l’espera de millores substancials. Fa més d’una setmana que 3w2 IA Labs ha estat treballant amb DeepSeek, però les proves s’han vist interrompudes per l’alta demanda d’accés a la plataforma pública, que ha col·lapsat temporalment. Ara esperem la recuperació del servei per reprendre les nostres avaluacions.

Què és DeepSeek i per què desperta tant interès?

DeepSeek, que en anglès significa “Cerca Profunda”, és un sistema d’intel·ligència artificial de codi obert que destaca per ser completament gratuït. Aquesta característica contrasta amb els models occidentals com ChatGPT, que sovint requereixen subscripcions de pagament per accedir a les seves funcions avançades. DeepSeek ha estat desenvolupat com una alternativa assequible i potent per democratitzar l’accés a les tecnologies d’IA.

El sistema disposa de diversos models especialitzats. D’una banda, DeepSeek-V3 es centra en la processació de grans bases de dades per oferir resums d’articles i informació actualitzada en temps real, una funció molt valuosa per a la recerca i el periodisme. De l’altra, DeepSeek-R1 està orientat a solucionar problemes tècnics i oferir respostes pràctiques a desafiaments de programació. Aquest darrer model és el que més ha inquietat les grans empreses tecnològiques, ja que ha demostrat uns resultats sorprenents en l’àmbit tècnic.

DeepSeek en flux tancat: requisits i compatibilitats

Tot i els rumors mal entesos sobre l’ús lleuger del sistema, per instal·lar i executar DeepSeek de manera local, és imprescindible disposar de de màquines de gran capacitat. Això es deu a la seva arquitectura avançada i als elevats requisits de processament necessaris per gestionar models d’aquest tipus. Segons les especificacions recomanades, aquí detallem les necessitats per treballar amb DeepSeek en flux tancat:

GPU: Per al model complet de 236B paràmetres, calen almenys 80 GB de memòria distribuïts en 8 GPUs d’alt rendiment. Els models més petits, com el DeepSeek-R1-Distill-Llama-70B, exigeixen menys recursos però continuen requerint maquinari avançat. Les versions destil·lades més compactes, com el model Qwen-1.5B, són més accessibles per a sistemes amb recursos limitats.

TPU: A més de les GPUs, DeepSeek és compatible amb TPUs de gran capacitat, una opció cada cop més popular per a investigadors que busquen optimitzar el rendiment dels seus sistemes.

Compatibilitat amb NVIDIA, AMD i NPUs Huawei Ascend: Aquesta versatilitat en les opcions de maquinari és un dels punts forts de DeepSeek. La compatibilitat amb GPUs NVIDIA i AMD, així com amb les NPUs Huawei Ascend, permet als usuaris adaptar les seves implementacions a les necessitats específiques de cada projecte.

És essencial garantir una potència de processament i una capacitat de memòria adequades, especialment si es treballa amb models més grans, com el model base de 671B paràmetres, que requereix una infraestructura tecnològica robusta. El servei Hetzner Matrix GEX130, amb un maquinari altament avançat, és una plataforma ideal per al desenvolupament amb DeepSeek. La CPU Intel® Xeon® Gold 5412U amb 24 nuclis ofereix un rendiment multi-threading excel·lent per gestionar les operacions computacionals intensives pròpies dels models de DeepSeek.

La RAM de 128 GB DDR5 ECC reg assegura una memòria ràpida i fiable, essencial per executar models grans com el DeepSeek-V3 o el DeepSeek-R1, que requereixen altes capacitats de processament i estabilitat. L’emmagatzematge d’alt rendiment amb 2x 1,92 TB Gen 4 proporciona velocitats d’I/O òptimes per manejar grans bases de dades i carregar models de manera eficient.

El punt clau és la GPU NVIDIA RTX™ 6000 Ada Generation, que ofereix un rendiment tensorial de 1457.0 TFLOPS, una característica crítica per accelerar el processament de xarxes neuronals profundes. Aquesta GPU no només suporta la formació i inferència de models complexos, sinó que també és compatible amb les principals biblioteques d’IA com TensorFlow i PyTorch, facilitant la implementació de DeepSeek en entorns locals d’alt rendiment.

Finalment, la reducció del cost mensual a 838 euros fa que aquesta plataforma sigui més accessible, oferint una relació qualitat-preu altament competitiva en comparació amb altres solucions similars, que superen els 1.200 euros mensuals i més. Això converteix el Hetzner Matrix GEX130 en una opció rendible i tècnicament robusta per a equips que necessiten una infraestructura fiable per desenvolupar i optimitzar aplicacions amb DeepSeek.

Protecció de dades, un tema molt poc comentat però imprescindible.

Pel que fa als compliments del Reglament General de Protecció de dades i altres normatives europees, el flux tancat per a desenvolupaments a Hetzner és compatible atès que els datacenters es troben a Nuremberg, dins de la UE i ofereixen sistemes preparats per respectar i complir la regulació europea.

Sensacions preliminars: avantatges i limitacions

Les nostres proves inicials indiquen que DeepSeek i ChatGPT ofereixen resultats similars en moltes consultes generals, però s’observen diferències notables en certs aspectes clau. En consultes amb biaixos socials o culturals, DeepSeek revela una manipulació evident en el seu entrenament, fet que podria limitar la seva neutralitat en algunes respostes.

En relació a l’ús del català, OpenAI manté una clara superioritat tant en fluïdesa com en comprensió contextual, fet que situa ChatGPT en una posició avantatjosa per a la nostra comunitat lingüística. En aquest sentit és possible que DeepSeek requereixi entrenaments dedicats per arribar a un nivell òptim.

Malgrat aquestes limitacions, DeepSeek té punts molt forts. La seva gratuïtat i el fet de ser de codi obert el converteixen en una opció accessible i atractiva per a usuaris amb recursos limitats. A més, la seva capacitat per adaptar-se a contextos tècnics i oferir solucions pràctiques, especialment amb el model R1, obre noves possibilitats per a desenvolupadors i empreses.

DeepSeek representa un pas endavant en l’evolució de la intel·ligència artificial, amb un model obert que podria desafiar els grans jugadors occidentals. Tanmateix, encara necessita superar algunes mancances, especialment pel que fa a la qualitat lingüística i la neutralitat en les respostes.

Amb iniciatives com aquestes, Ràdio Verdú reafirma el seu compromís amb l’adopció crítica i responsable de la tecnologia, treballant sempre per mantenir la innovació al servei de les persones. Els pròxims mesos seran clau per entendre com DeepSeek pot redefinir el panorama de les intel·ligències artificials i com podem integrar-la en projectes futurs per enriquir l’experiència dels nostres oients i col·laboradors.

Ràdio Verdú28/01/2025

1 5 minuts de lectura