Exacomputer komt eraan

Tegen het jaar 2020 komen de eerste exacomputer op de markt, een supercomputer die één exaflop (10^18 berekeningen per seconde) haalt. Er staat niet alleen technologisch kunnen op het spel, maar ook nationale prestige. Europa is bezig zijn achterstand in te halen.

Op zich is het nu al technisch mogelijk een computer te bouwen die één exaflop op de teller zet. Dat apparaat trekt dan wel een vermogen van 500 Megawatt. Bij een kilowattuurprijs van 7 cent kost het dan 35.000 euro om hem een uur te laten draaien. Dat heeft niemand ervoor over. De energiekosten zullen met zeker een factor tien omlaag moeten, wil de exacomputer daadwerkelijk het leven zien.
De huidige nummer één in de internationale Top 500 van supercomputers, de Sunway TaihuLight van het National Supercomputing Centre in Wuxi (China), verbruikt 15,3 MW bij 93 petaflop. De nummer twee, de iets oudere Tianhe-2 te Guangszou (ook China), verbruikt overigens 17,8 MW voor 34 petaflop. Dat geeft al aan hoe belangrijk beheersing van de energiekosten is bij het ontwerp van steeds krachtiger computers.

Zeker zo opvallend is dat de sterkste computer een kloksnelheid heeft van 1,45 GHz, terwijl de nummer twee bij 2,20 Ghz draait. Hoe hoger de kloksnelheid, hoe hoger namelijk het energieverbruik per rekenstap. Vanuit energetisch oogpunt is het beter om meer rekenkernen parallel te laten draaien dan het aantal rekenstappen per rekenkern te maximaliseren. Vanuit software-oogpunt maakt die insteek het echter ingewikkelder.

Toen de Chinezen de macht grepen in superland, verbaasden ze niet alleen door de prestaties zelf, maar ook door de manier waarop ze die behaalden. De TaihuLight bevat in totaal ruim tien miljoen rekenkernen, verspreid over 40.960 Sunway processoren, die geheel van Chinese makelij zijn (mede vanwege een Amerikaans exportverbod voor Intels beste processoren, uit angst dat de Chinezen hun supercomputer voor nucleaire berekeningen inzetten). Het parallellisme is ongekend.

Parallel

‘Er zit een grote uitdaging in het parallelliseren van de software’, vertelt Walter Lioen, unit manager compute services bij SurfSara in Amsterdam, en in die rol onder meer verantwoordelijk voor de nationale supercomputer Cartesius. ‘Al valt maar één procent van de code niet te parallelliseren, dan is dat al een bottleneck voor de complete berekening. Eigenlijk is de bereikte parallellisering het meest knappe aan die Chinese machine.’

Nu zijn er berekeningen, zoals weer- en klimaatmodellen, die inherent parallel zijn. Meer rekenkernen betekent dat je het model in een hogere resolutie kunt uitrekenen. Echter, ook in dat geval werken de kernen niet volledig geïsoleerd van elkaar. Ze moeten regelmatig elkaars tussenresultaten kennen. Een deel van de tijd steken de kernen dus in onderlinge uitwisseling van data. Lioen: ‘De kunst zit dan in de juiste balans tussen rekenen en communiceren.’

Voor Nederland, met een in internationaal opzicht bescheiden budget, ligt de nadruk dan ook bruikbaarheid. Toen Cartesius in 2013 in bedrijf ging, was de rekenkracht geënt op de toenmalige behoefte van wetenschappers en de mogelijkheden van de software. Sindsdien heeft Cartesius twee substantiële updates gehad, waarvan de laatste afgelopen december. In de loop van dit jaar begint het aanbestedingstraject voor een nieuwe supercomputer, die eind 2018 operationeel zal moeten zijn. Dan wordt ook duidelijk waar de Nederlandse ambities liggen.

De bruikbaarheid zal mede getoetst moeten worden aan een nieuwe klasse van toepassingen. Traditioneel ligt de nadruk op wetenschappelijk rekenwerk. Door de opmars van big data groeit de behoefte aan razendsnel analyseren van grote hoeveelheden gegevens. Dat vergt een andere benadering van de software en daarmee ook van de hardware waarop die efficiënt moet draaien.

Toppositie

Met alle aantekeningen over de bruikbaarheid van rekenbeesten ligt de internationale nadruk echter wel degelijk op de exaflop. Het is een relatief eenvoudig meetbare eenheid, waarvoor een erkende standaard bestaat. Dus is hij ook bruikbaar als inzet voor een prestigestrijd. Er zijn vier partijen in de race: China, Amerika, Japan en Europa. Doel is niet zozeer om als eerste over de finish te gaan, maar om liefst voor langere tijd een technologische toppositie vast te houden.

De Chinezen openbaarden hun plannen afgelopen najaar, niet lang nadat de TaihuLight operationeel werd. Eind dit jaar moet een prototype van de opvolger klaar zijn. Die moet ruim tien keer zo snel zijn als de 93 petaflop van de TaihuLight om de exaflop te halen, en liefst minder energie verbruiken. Het apparaat zou in 2020 operationeel moeten zijn. Of de apparaten, want China heeft maar liefst drie projecten tegelijkertijd opgestart om de mijlpaal te behalen.

Ook de Amerikanen gokken niet op één architectuur voor hun exacomputer. De race winnen zit er niet in, want het tijdschema wijst nu op zijn vroegst op 2023. Het is zelfs mogelijk dat het bij gebrek aan financiering helemaal niet doorgaat. De nieuwe president Donald Trump heeft geen grote belangstelling voor wetenschap en zelfs een weerzin tegen klimaatwetenschappers die een drijvende kracht zijn achter de parallelle rekenbehoefte waarin supercomputers voorzien. De snelste computers van de VS staan allemaal bij laboratoria van het Department of Energy, dat onder leiding komt te staan van Rick Perry, die het hele ministerie wilde opheffen toen hij vier jaar geleden zelf president probeerde te worden.

Japan is een serieuzere kandidaat om de Chinezen te overtroeven. Fujitsu heeft momenteel twee computers in de top tien staan en heeft een overheidsopdracht in de zak om een exacomputer te bouwen voor het nationale onderzoeksinstituut Riken. Fujitsu beschikt nu al over de technologie om 100 Petaflop te halen en niemand twijfelt eraan dat het plan om in 2020 op een exaflop te zitten haalbaar is voor de Japanners.

Europa

De Europeanen zijn de grote verrassing in de race (als je occasionele geluiden uit Rusland en India niet meetelt). Het Franse Atos heeft een roadmap vastgesteld die zijn Bull Sequana computers in 2020 bij de exaflop moet brengen. De eerste Sequana werd in december operationeel door de update van Cartesius bij SurfSara en bereikt 1,8 petaflop. Daarmee haal je de huidige top 50 niet. In de Green 500, die het energieverbruik per rekenstap bijhoudt, doet Atos het gemiddeld beter – niet onbelangrijk gegeven de grote rol van energieverbruik in de betaalbaarheid van het apparaat.

‘Bovendien wordt koeling een uitdaging’, vult Hugo Meiland van Atos aan. ‘We zitten nu aan het maximum dat we met lucht kunnen koelen, zo’n 10 kilowatt per kast. Wanneer we naar 100 kilowatt per kast gaan is volledige waterkoeling noodzakelijk. Daarmee zijn we een eind op weg.’

Naast energieverbruik en als gevolg daarvan koelingsbehoefte is de interconnect, ofwel de verbinding tussen de processoren, de grootste technische uitdaging, geeft Meiland aan. Atos heeft zijn eigen interconnect-technologie ontwikkeld. Voor processoren is het afhankelijk van externe leveranciers (momenteel vooral Intel). ‘Wij maken in de eerste plaats de technologie klaar’, aldus Meiland. ‘Daarna is het aan de gebruikers – al werken we vanzelfsprekend nauw met hen samen bij het aanpassen van de software.‘

Ambities

Uiteraard trekt Atos niet in zijn eentje aan de Europese exaschaal-ambities. Binnen het EU-onderzoeksprogramma Horizon 2020 is op verschillende manieren geld uitgetrokken voor supercomputers: voor technologische ontwikkeling op de lange termijn, voor het uitwisselen van operationele ervaringen en voor de ontwikkeling van toepassingen.

‘De Europese Commissie wil dat de industrie zich ontwikkelt en heeft in april 2016 besloten 4,7 miljard euro extra uit te trekken voor het European Cloud Initiative’, zegt Anwar Osseyran, directeur van SurfSara en voorzitter van Prace, het samenwerkingsverband van Europese supercomputercentra. ‘De ranking in de Top 500 is een uitdaging voor leveranciers, maar het gaat ook om het prestige van landen. Het was voor de Amerikanen echt een schok dat ze door China werden weggeblazen.’

Expliciet onderdeel van het European Cloud Initiative is de ambitie om in 2020 tenminste één supercomputer in de top drie van krachtigste apparaten ter wereld te hebben. China hoeft dus niet per se afgetroefd te worden, maar de VS in elk geval voorbijgestoken, zegt de EU daarmee. Atos heeft vooralsnog geen plannen een eigen processor te ontwerpen, maar inwisselen van het Amerikaanse Intel voor het Britse ARM behoort wel tot de mogelijkheden. Europa wil in elk geval niet afhankelijk zijn van één externe leverancier.

De experts bij Top 500 verwachten dat China of Japan de eerste exacomputer zal bouwen, maar vermoeden ook dat de race niet zal leiden tot de meest efficiënte architectuur. Er zal genoeg reden zijn om door te willen marcheren naar de zettaflop.

×