E-science is een spin in het web

Een steeds groter deel van de wetenschap leunt op e-science, het vakgebied dat zich bezig houdt met het verwerken, organiseren, modelleren en analyseren van grote hoeveelheden data. Zonder e-science zouden vele moderne terreinen onontgonnen blijven, omdat ze zonder rekenkracht niet te betreden zijn. Aan steeds meer wetenschappelijke prestaties ligt dan ook e-science ten grondslag, zoals onder andere blijkt uit het grote aantal Spinoza prijzen dat erop steunt.

Het zwaartepunt E-science zorgt in de breedste zin voor die ondergrond. In de fundamentele e-science gaat het daarbij om de principes van informatieverwerking. De kernvraag is heel oud: welke principes van informatie en kennis bepalen de processen in de wereld? Wat is een goede manier om informatie en kennis te representeren, en wat is de juiste manier om ermee te redeneren? De beantwoording van deze abstracte vraag is door de computer in een stroomversnelling gekomen, maar de vraag naar de relatie tussen data, informatie en kennis is nog steeds de kern.

Bovenop de fundamentele laag ligt die van de strategische e-science. In deze laag zitten de componenten van de kringloop die ten grondslag ligt aan de exacte wetenschappen: experimenteren, analyseren, theoretiseren, modelleren – en opnieuw experimenteren. Methodes en technieken voor het mobiliseren van data en rekenkracht, voor netwerken van computers en data, voor het modelleren en simuleren, voor het analyseren en de mining van data staan hier centraal. Ook het visualiseren van informatie en kennis en de integratie van al deze componenten horen in deze laag. In de gamma- en alfawetenschappen is een dergelijke kringloop ook in opkomst, maar geïsoleerde experimenten zijn daar vaak onmogelijk. Methodes voor het afgraven en structureren van bestaande databestanden is daar een grote uitdaging.

Misdaadbestrijding

Deze strategische componenten worden ingezet in de toepassingsgebieden van e-science. Andere zwaartepunten, zoals astrodeeltjesfysica, cognitie en biosystemen, zijn goede voorbeelden van velden waarmee het zwaartepunt e-science intensief samenwerkt. Daarbuiten zijn er echter ook talloze, variërend van de voedselindustrie, materiaalkunde, epidemiologie of waterbeheer tot sociale verzekeringen, misdaadbestrijding en televisie-archieven. De hele samenleving maakt op dit moment een informatie-explosie door en er liggen spannende zaken verborgen in de bergen met data.

Het zwaartepunt heeft in haar vakgebied een sterke uitgangspositie, want Amsterdam en Nederland zijn altijd al sterk geweest. Naast AMS-IX, een van de grootste internetknooppunten ter wereld, zijn in de Watergraafsmeer het CWI en de universitaire het rekencentrum SARA er gevestigd. Ook met de VU wordt nauw samengewerkt. Voor de toepassing van e-science in andere takken van wetenschap zijn derhalve alle expertise en faciliteiten binnen handbereik. Bijna geen vakgebied kan nog zonder.

Zoeken naar structuur in informatie

Biologen verzamelen al enkele eeuwen informatie over planten en dieren. Dat doen ze allemaal op hun unieke manier, met hun eigen methoden en definities. Zo lang ze mondeling of schriftelijk met elkaar communiceren is dat geen enkel probleem, want ze begrijpen onderling wat ze bedoelen. Als je echter uit al die informatie een beeld zou willen krijgen van de biodiversiteit op de wereld, moet die enorme hoeveelheid informatie door een computer geanalyseerd worden. Daarvoor moet ze echter wel vergelijkbaar zijn.

Het zoeken naar een geschikte structuur voor die biodiversiteitsdata is een typische klus voor een e-scientist. Maar het zou jammer zijn als bij een ander probleem, bijvoorbeeld structuur aanbrengen in medische informatie, helemaal opnieuw begonnen zou moeten worden. Daarom zoekt een e-scientist naar methoden die breder toepasbaar zijn. Als je bijvoorbeeld iets weet over hoe mensen vluchten uit de gangen van een brandend gebouw zegt dat dan ook iets over het verband tussen bewegingen van individuele moleculen in een bloedbaan?

Het analyseren van een gigantisch archief van televisiebeelden is een ander complex voorbeeld. Hoe weet je wat je ziet? Stel dat je alle fragmenten met “dieren” uit het archief wil hebben, wat moet je dan uitrekenen om die te krijgen? Hoe pak je het aan voor ‘auto’s’ of ‘vrolijkheid’, zonder voor iedere vraag een nieuwe methode te moeten bedenken? Welke onderscheiden zijn toevallig, welke essentieel? Hoe vervoer je al die digitale televisie informatie? Doordringen in het wezen van informatie is de kern van e-science.

×