3 lecturi de duminică: DeepSeek - Lina Khan a avut dreptate; Antiqua et Nova - ce crede Vaticanul despre AI; Jevons și Moravec

Lina Khan, fostul președinte al Comisiei Federale pentru Comerț din SUA, a avertizat cu privire la „consecințele catastrofale” pentru America dacă oficialii antitrust ai lui Donald Trump nu reușesc să examineze grupurile de capital privat care cumpără o parte din economia SUA.
Ryan Grim, DeepSeek just proved Lina Khan right:
Acțiunile tehnologice din SUA se prăbușesc, deoarece China pare să arate că firmele americane implicate în AI sunt extrem de supraevaluate. Este o consecință previzibilă a modului în care guvernul american a abordat Silicon Valley și invers.
Companiile de tehnologie din SUA, cu sprijinul guvernului federal (și al Pentagonului), și-au construit o poziție dominantă la nivel mondial prin inovație reală. Microsoft, Facebook, Apple, Google și Amazon au remodelat lumea. Microsoft, una dintre primele companii majore care a crescut, a încercat să oprească această inovație cumpărând și/sau zdrobindu-și concurenții, dar SUA au dat-o în judecată, în 1998, pentru încălcarea legilor antitrust. Administrația Bush a soluționat cazul. Ceea ce a urmat a fost o îmbrățișare bipartizană a Big Tech; epoca Bush și Obama au cunoscut fuziuni și o creștere nestăvilită. Pe măsură ce companiile tehnologice vedeau firmele mai mici inovând, cumpărau compania, o anihilau și absorbeau o parte din personalul său.
O mișcare anti-monopol a început să apară, ducând la procese împotriva Facebook, Amazon, Google și Apple în ultimul deceniu. Lina Khan, în calitate de președinte al Comisiei Federale de Comerț sub fostul președinte Joe Biden, a devenit un erou popular, avertizând că lăcomia și nu dăunează doar consumatorilor și că marile companii vor suferi, în cele din urmă, din cauza lipsei de concurență. „Istoria noastră arată că menținerea piețelor deschise, echitabile și competitive, în special în punctele de inflexiune tehnologică, este o modalitate cheie de a ne asigura că America beneficiază de inovația pe care o pot cataliza aceste instrumente”, a spus Khan în 2023.
Acum a devenit clar că șanțul de apărare construit de SUA pentru a-și proteja companiile de concurența internă a creat de fapt condițiile care le-au permis să se atrofieze. S-au îngrașat și trăiau fericiți în castelele lor. Acum DeepSeek a dezvăluit înșelătoria. Cu resurse limitate și fără acces la întreaga panoplie de tehnologie cu cipuri din SUA, compania chineză DeepSeek a depășit Silicon Valley. Compania americană OpenAI a început ca o organizație nonprofit dedicată punerii la dispoziție AI pe scară largă, așa cum sugerează și numele.
DeepSeek îndeplinește, în mod ironic, misiunea inițială a OpenAI, oferind un model open-source care pur și simplu funcționează mai bine decât oricare din piață.
Între timp, în Statele Unite, Trump sărbătorește o investiție (posibil exagerată) de 500 de miliarde de dolari, în Texas, pentru a alimenta puterea computerelor AI care pare să fie depășită - sau mult mai puțin relevantă – ca urmare a inovației DeepSeek. Iar Trump își mobilează Administrația cu cryptobros și moguli ai tehnologiei. Consilierii seniori ai lui Trump, precum Elon Musk, au între timp legături comerciale extinse direct cu China.
Contractul social încheiat între guvernul SUA și Silicon Valley - la care poporul american a devenit parte involuntară - a fost simplu: vom lăsa câțiva tehnocrați să devină nespus de bogați și, în schimb, vor construi o industrie tehnologică care să mențină America dominantă la nivel global. Aceștia, însă, au încălcat înțelegerea. Au luat banii, dar în loc să continue să inoveze și să concureze, au construit monopoluri pentru a ține departe concurența - chiar au primit ajutorul securității naționale pentru a bloca accesul Chinei la tehnologia americană. Dar nu au putut să stea departe de competiție pentru totdeauna. Lina Khan avea dreptate.
Efectele în aval vor fi profunde dacă traiectoria unui transfer de bogăție din SUA către China va continua cu ritm rapid.
Compania chineză DeepSeek a lansat un model AI care este la fel de bun ca oricare dintre omologii săi americani și l-a făcut open source. Acest lucru a schimbat în mod fundamental economia și politica industriei AI în curs de dezvoltare, care a fost condusă până acum de un oligopol de companii tehnologice americane ce încearcă să poziționeze Modelele lingvistice mari (Large Language Models, LLM) drept descoperirea tehnologică definitorie a acestui secol și pe ei înșiși ca păstrătorii rețetei secrete.
Se vorbește mult despre DeepSeek care necesită suma modică de aproximativ 6 milioane de dolari, deși această cifră nu include cercetarea și dezvoltarea. Și, în pofida controalelor la export, DeepSeek a reușit să exploateze un număr care nu e oarecare de cipuri de înaltă tehnologie.
O lucrare din 2017 intitulată „Atenția este tot ce aveți nevoie” a fost un punct de cotitură în industria AI. Lucrarea descria o metodă de creare a unui model de învățare automată care ar putea produce text asemănător omului cu o precizie și la o scară fără precedent, folosind o arhitectură numită „transformers”. Acești „transformers” au îmbunătățit considerabil o clasă de modele numite Large Language Models. LLM-urile folosesc cantități masive de text - cărți, articole, e-mailuri, rețete, întrebări frecvente - pentru a crea reprezentări matematice interne ale relațiilor dintre miliarde de cuvinte și expresii - sau, mai precis, între combinații de simboluri care se găsesc într-un limbaj uman natural. Înainte de 2017, LLM-urile nu erau foarte utile, dar „transformers” au schimbat asta. Prin procesarea unor cantități mari de text folosind arhitectura „transformers”, aceste modele ar putea acum „învăța” ce înseamnă cuvintele în diferite contexte și pot detecta nuanțe, ceea ce computerele nu au mai făcut niciodată, permițând acestor modele să producă text extrem de relevant ca răspuns la o solicitare a utilizatorului.
Cum a început hype-ul AI? OpenAI a devenit prima companie americană care a demonstrat că, dacă faceți un instantaneu al întregului internet cunoscut și al tuturor cărților digitizate existente fără să vă faceți prea multe griji cu privire la legea drepturilor de autor, puteți crea un model atât de bun încât produsul său ar fi aproape imposibil de distins de cel al unui birocrat cu inteligență mediocră. OpenAI a arătat că modelul său ar putea fi antrenat pentru a avea experiență în diferite domenii și ar putea oferi răspunsuri aprofundate la întrebări foarte specifice. Modelul său a promovat examenele de codificare și a absolvit școala de afaceri. Rezultatele au fost atât de șocante încât OpenAI a ieșit și a susținut că valorează un miliard de dolari și că viitorul umanității depinde de el. OpenAI, deținut parțial de Microsoft, a fost primul care a lansat un produs major LLM, ChatGPT, în noiembrie 2022. La scurt timp după, Meta și-a lansat propriul model, LLaMa, iar Google a lansat Gemini. Toate cele trei companii aveau cantități masive de text pentru a-și instrui modelele, dar un LLM are nevoie de un alt ingredient crucial: puterea de calcul pentru a procesa acel text și apoi pentru a genera răspunsuri la interogările utilizatorilor. Compania lider care produce mașini de calcul este Nvidia, ale cărei acțiuni au crescut exponențial ca răspuns la războaiele LLM conduse de OpenAI/Microsoft, Google și Meta. Mașinile de calcul se numesc GPU-uri - unități de procesare grafică. Au fost inventate inițial pentru a procesa grafica pe computer pentru jocuri, cum ar fi randarea 3D. Mai târziu au devenit populare, deoarece capacitățile lor de procesare paralelă le-au făcut să fie perfecte pentru minerit de criptomonede. Acum, se pare că sunt, de asemenea, grozave la procesarea datelor AI din motive similare. Nvidia a călărit, practic, valuri de boom-uri pe măsură ce diferite piețe au descoperit noi utilizări pentru produsul său.
În ultimii câțiva ani, Meta, Google, Microsoft și OpenAI au reușit să strângă sute de mii dintre cele mai avansate GPU-uri și să beneficieze de un tratament preferențial atât de la Nvidia, cât și de la furnizorul său, principalul producător mondial de semiconductori, TSMC.
Industria tehnologică americană a făcut pași importanți pentru a se alinia în jurul AI. Companiile au achiziționat startup-uri, au recrutat cercetători de top în domeniul inteligenței artificiale și au investit resurse în dezvoltarea modelelor lor de inteligență artificială primară (numite modele fundamentale), creând un flux de investiții în inteligența artificială și în tehnologiile conexe, cum ar fi cloud computing, producția avansată de cipuri și infrastructura de date.Toate acestea sunt o încercare de a asigura dominația în ceea ce ei pretind că este următoarea frontieră a inovației tehnologice.
Ca parte a efortului său mai amplu de a limita China, guvernul SUA a avut misiunea de a împiedica companiile chineze să devină lideri în diferite domenii ale tehnologiei. A făcut acest lucru deținând controlul asupra lanțurilor globale de aprovizionare și protejând companiile americane de tehnologie de concurență. SUA au blocat intrarea Huawei în Statele Unite exact în momentul în care a depășit Apple pentru a deveni al doilea cel mai mare producător de smartphone-uri din lume; a împiedicat țările europene să instaleze infrastructura 5G fabricată de Huawei, atunci când era în mod clar mai economică; și cel mai recent, a adoptat o legislație care interzice TikTok, o aplicație chineză de socializare care a devenit masiv populară în Statele Unite și al cărei algoritm de recomandare nu a fost depășit de nicio aplicație americană de social media. SUA susțin că Huawei și alte companii tehnologice chineze sunt indisolubil legate de strategia geopolitică a Chinei și pun companiile și persoanele la un risc crescut de supraveghere și spionaj corporativ, ceea ce este, desigur, bazat pe realitate. DeepSeek nu se rușinează de câte date colectează pe platforma sa, inclusiv de la simpla apăsare a tastelor: „colectăm anumite informații despre dispozitiv și conexiune la rețea atunci când accesați Serviciul. Aceste informații includ modelul dispozitivului, sistemul de operare, modelele sau ritmurile de apăsare a tastei, adresa IP și limba sistemului. De asemenea, colectăm informații legate de servicii, diagnostic și performanță, inclusiv rapoarte de blocare și jurnalele de performanță. Vă atribuim automat un ID de dispozitiv și un ID de utilizator. În cazul în care vă autentificați de pe mai multe dispozitive, folosim informații precum ID-ul dispozitivului și ID-ul utilizatorului pentru a vă identifica activitatea pe toate dispozitivele, pentru a vă oferi o experiență de conectare fără probleme și în scopuri de securitate”.
Cu toate acestea, deoarece DeepSeek este open source și poate rula local pe un dispozitiv separat, te poți proteja de privirile indiscrete ale președintelui Xi Jinping.
Menținerea dominației tehnologice globale este una dintre preocupările cheie pe care factorii de decizie din SUA le-au citat în mod repetat și au identificat inteligența artificială ca fiind o tehnologie crucială în menținerea acestei dominații. În 2018, când guvernul SUA era în proces de interzicere a Huawei, și-a dat seama că va trebui să facă același lucru cu tehnologiile din aval, cum ar fi cipurile semiconductoare, componenta principală folosită în procesoare și GPU. Lipsa severă de cipuri din cauza întreruperilor lanțului global de aprovizionare în timpul Covid-19 a arătat că cipurile avansate reprezintă un blocaj al lanțului global de aprovizionare și o resursă limitată. Până în 2022, administrația Biden a impus sancțiuni ample asupra Chinei, oprind exportul acestor cipuri în țară și împiedicând companiile chineze de inteligență artificială să acceseze cele mai noi și mai eficiente GPU-uri. În același timp, a adoptat legea CHIPS, subvenționând producția națională de semiconductori cu peste 50 de miliarde de dolari.
Marile companii de tehnologie au spus guvernului și investitorilor că realizarea AI este foarte, foarte costisitoare. În prima sa săptămână de mandat, președintele american Donald Trump a anunțat investiții de 500 de miliarde de dolari în sectorul privat, în AI, în cadrul unui proiect numit Stargate, o colaborare între OpenAI, Softbank și Oracle. În trecut, fondatorul OpenAI, Sam Altman, a susținut că ar avea nevoie de până la 7 trilioane de dolari pentru a crea un AI de vis. Nimeni din întreaga istorie a lumii nu a cheltuit vreodată această sumă de bani pe un singur lucru. Dar mesajul de bază pare să fie: aceasta este o tehnologie magică și o forță mai puternică decât orice altă lume a văzut-o vreodată, avem nevoie de sume astronomice de bani pentru a o construi și avem nevoie de protecția guvernului SUA în timp ce facem acest lucru.
Apoi a apărut o mică companie chineză care a dezlănțuit urgia. A folosit o putere de calcul în valoare de 5,5 milioane de dolari pentru a face acest lucru, folosind doar 2.048 de GPU-uri Nvidia H800, pe care compania chineză le avea, deoarece nu a putut cumpăra GPU-urile superioare H100 sau A100 pe care companiile americane le adună în sute de mii.
Ca idee, Meta AI și-a stabilit ținta de a deține un cluster de 600.000 de GPU-uri H100 până la sfârșitul anului 2024. Elon Musk are 100.000 de GPU-uri, în timp ce OpenAI și-a antrenat modelul GPT-4 pe aproximativ 25.000 de GPU-uri A100. Între timp, potrivit presei chineze, DeepSeek a fost fondată de managerul chinez de fonduri speculative High Flyer, care dorea să-și folosească clusterul de 10.000 de GPU H800. DeepSeek, conform tradiției, a angajat o echipă foarte tânără și i-a motivat să inoveze și să profite la maximum de hardware-ul limitat. Ei au lansat, luna trecută, modelul DeepSeek-V3, un model care depășește OpenAI GPT-4 și toate celelalte modele din industrie în majoritatea benchmark-urilor. Nu există nicio dezvoltare semnificativă în tehnologia de bază, doar folosesc hardware-ul eficient și își antrenează mai bine modelul.
Tehnocrații sunt supărați pentru că acest lucru îi face să arate rău. Ceea ce complică și mai mult lucrurile este că DeepSeek și-a lansat modelul și metodele de antrenament ca software open source, ceea ce înseamnă că oricine poate vedea cum și-a creat modelul și poate replica procesul. De asemenea, înseamnă că utilizatorii pot instala modele DeepSeek pe propriile lor dispozitive și le pot rula pe propriile GPU-uri, unde par să funcționeze foarte bine.
Unii susțin că acesta este „momentul Sputnik al AI”. Alții nu au fost atât de generoși.
„ ...în lumina discuției de mai sus, diferențele dintre inteligența umană și sistemele actuale de inteligență artificială devin evidente. În timp ce AI este o realizare tehnologică extraordinară, capabilă să imite anumite rezultate asociate cu inteligența umană, ea funcționează prin îndeplinirea sarcinilor, atingerea obiectivelor sau luarea deciziilor bazate pe date cantitative și logica computațională. De exemplu, cu puterea sa analitică, AI excelează în integrarea datelor dintr-o varietate de domenii, modelarea sistemelor complexe și promovarea conexiunilor interdisciplinare. În acest fel, poate ajuta experții să colaboreze în rezolvarea unor probleme complexe care nu pot fi tratate dintr-o singură perspectivă sau dintr-un singur set de interese. Cu toate acestea, chiar dacă AI procesează și simulează anumite expresii ale inteligenței, ea rămâne în mod fundamental limitată la un cadru logico-matematic, care impune limitări inerente. În schimb, inteligența umană se dezvoltă organic pe parcursul creșterii fizice și psihologice a persoanei, modelată de o multitudine de experiențe trăite în carne și oase...” (fragment)
Dicasterul pentru Doctrina Credinței este un departament al Curiei Romane, cu sediul lângă Vatican.
Un comentariu la o postare despre Paradoxul lui Jevons, realizată pe X de Satya Nadella (director Microsoft), aduce în discuție și Paradoxul lui Moravec...„pentru cei preocupați de efectul negativ al Deepseek R1 asupra NVIDIA”.
În economie, paradoxul Jevons (numit și efectul lui Jevons), apare atunci cand progresul tehnologic sau politica guvernamentala măresc eficiența cu care este utilizată o resursă, dar rata consumului acelei resurse crește, din cauza creșterii cererii.
Se spune că Nvidia își va reveni și va câștiga mai mulți bani. Tocmai din cauza Paradoxului lui Jevons: pe măsură ce AI devine mai eficientă și mai accesibilă, utilizarea sa va crește vertiginos, transformându-o într-o marfă de care nu ne vom putea lipsi.
Paradoxul lui Moravec este ceea ce au observat cercetătorii din AI și robotică: spre deosebire de presupunerile tradiționale, raționamentul necesită foarte puține calcule, dar abilitățile senzo-motorii și de percepție necesită resurse computaționale enorme. Moravec a scris în 1988: „este relativ ușor să faci computerele să prezinte performanțe la nivel de adult la testele de inteligență sau la jocul de dame și dificil sau imposibil să le oferi abilitățile unui copil de un an când vine vorba de percepție și mobilitate”.