De hele wereld is in de ban van de corona-uitbraak. In Nederland werken mensen die niet in een vitaal beroep werken thuis en ontmoetingen met meerdere mensen zijn verboden. Podcast De Dataloog moest daarom ook anderhalve week worden uitgesteld. Maar na wat technisch geknutsel is het de makers gelukt om de podcast dan toch op te nemen en op 4 april 2020 uit te zenden. Ieder op z’n eigen locatie konden we natuurlijk niet om corona heen, dit thema staat dan ook in de uitzending centraal. Verder komen er nog items aan bod over investeringen in Nederlandse startups, trends in ai, ict als vitale sector en gemeenten die digitale besluiten mogen gaan nemen. Jurjen Helmus van de Hogeschool van Amsterdam, Walter van der Scheer van GoDataDriven en Computable-hoofdredacteur Sander Hulsman lieten dit en ander datanieuws van de afgelopen weken de revue passeren.
In 2019 waren er tweemaal zoveel investeringen in Nederlandse startups en scale-ups dan in 2018. Dit blijkt uit een onderzoek van Golden Egg Check. In 2018 werd er nog 750 miljoen euro opgehaald, in 2019 steeg dit naar 1,4 miljard euro. Het aantal deals (286) is ook toegenomen. Amsterdam de plek is waar de meeste investeringen gedaan zijn. In de hoofdstad werd een derde van alle deals gedaan, goed voor de helft van al het geld, te weten zevenhonderd miljoen euro. Naar aanleiding van het onderzoek is ook een speciale paper ontwikkeld. Een voorbeeld van een investering is die van twee miljoen euro in de Nederlandse startup Dutch Analytics.
MIT en ict wordt vitaal
MIT heeft een rapport geschreven over de ai-trends van de toekomst en over de afgelopen jaren. Manufacturing komt prominent naar voren als sector die verwacht dat data driven en algoritmes de komende jaren geïmplementeerd gaan worden. Alleen de financiële sector scoort hoger. De bevindingen van MIT staan wel haaks op een onderzoek van Siemens. Hieruit blijkt dat één op de vijf machinebouwers het ontwikkelen van ai-toepassingen kwalificeert als belangrijk of kritiek.
It en telecom zijn voor de coronacrisis in algemene zin aangemerkt als vitale processen in de categorie B. Dit wil zeggen dat uitval tot ernstige maatschappelijke en economische schade kan leiden. Als de nood aan de man is en een totale lockdown zou plaatsvinden, kan de sector daarom toch doordraaien. Concreet houdt dit in dat medewerkers van datacenters, hostingbedrijven en clouddiensten tijdens een lockdown toch de straat op mogen gaan.
Corona shoutouts
In moeilijke tijden zijn er altijd branches, organisaties, personen en initiatieven die ons helpen de crisis te doorstaan. De makers van De Dataloog delen dan ook shoutouts van enkele online initiatieven die de echte data en ook de echte onzekerheid ten tijde van de coronacrisis naar voren durven te brengen.
@Datagraver, en dan met name ceo Stephan Okhuijsen, brengt iedere dag op social media de laatste data-analyses uit waarbij ze kijken naar de totale groei van besmettingen en doden en de groeifactor die heel belangrijk. Is. Ze doen dit niet alleen voor Nederland maar alle landen waarvoor data beschikbaar is.
@JPeterBurger debunkt dagelijks het fake nieuws. Hij is van onschatbare waarde op sociae media. Daarnaast heeft @Nieuwscheckers nog maar een paar inschrijvingen nodig voor duizend nieuwsbriefvolgers. Dit zijn de Factcheckers van de opleiding Journalistiek & Nieuwe Media van de Universiteit Leiden die onder supervisie van @APleijter en @JPeterBurger.
Bert Slagter van @LekkerCryptisch schreef een heel goed stuk over complexe systemen en onzekerheid. En over de Powerlaw die in complexe systemen een belangrijke distributie is. Het gekke van de Powerlaw is namelijk dat hij exponentieel is, en bij sommige exponenten geen gemiddelde of standaard deviatie heeft.
Op Github is de Epidemic Calculator terug te vinden over het modelleren van de dynamiek in virusverspreiding. Het laat heel mooi de dynamiek van het systeem zien en hoe maatregelen impact kunnen hebben.
Op de website van Nextstrain wordt het Covid19-virus genetisch geanalyseerd en wordt de verspreiding ervan bijgehouden.
Pipple en Zoom
Startup Pipple heeft een algoritme voor het plannen van ziekenhuiscapaciteit geïmplementeerd bij het Jeroen Bosch Ziekenhuis in regio ’s-Hertogenbosch. Ze kozen heel bewust voor Excel en niet voor nieuwe technologie om snel de oplossing te kunnen opleveren om snel in te kunnen spelen op de actuele nood. Soms hoeft het allemaal niet zo ingewikkeld en complex te zijn om digitale hulp te kunnen bieden!
Door corona moeten heel veel mensen thuiswerken en dan zoek je naar videocontact, bijvoorbeeld via Zoom. Maar wees voorzichtig! Zoom blijkt toch minder veilig dan gedacht. Vorig jaar kwam deze aanbieder van videoconferencing software al negatief in het nieuws toen bleek dat de software een webserver installeerde die ook nadat je Zoom had verwijderd bleef draaien. Nu is gebleken dat Zoom data van gebruikers doorlust naar Facebook, ook als gebruikers helemaal geen account bij Facebook hebben. De lus is inmiddels verwijderd.
Hackers en e-mailscams
Hackers proberen massaal een slaatje te slaan uit de problemen rond het coronavirus. Veiligheidsexperts waarschuwen voor aanvallen op bedrijven die zijn overgeschakeld op thuiswerk. Computercriminelen proberen thuiswerkers hun wachtwoorden te ontfutselen. Ook wordt gezocht naar zwakke plekken die zijn ontstaan nu veel medewerkers op afstand werken. Bedrijven zijn nu gemakkelijker te infiltreren. Persbureau Reuters constateert dat werknemers niet alleen hun laptops maar ook belangrijke bedrijfsgegevens mee naar huis nemen, wat extra risico’s oplevert.
De hoeveelheden e-mailscams zijn de afgelopen week bijna verdrievoudigd. Aanvallers doen zich ook steeds meer voor als de Wereldgezondheidsorganisatie (WHO). SophosLabs, het onderzoekslab van security specialist Sophos, stelt vast dat het aantal spam, phishing-aanvallen en malware, met het gebruik van ‘Covid-19’ en ‘coronavirus’ omhoog is geschoten. Het geschatte, wereldwijde spamvolume ligt op honderden miljarden; twee tot drie procent daarvan is Covid-19 gerelateerd.
Fox-IT en hyperscalers
Sinds donderdag 2 april 2020 stelt Fox-IT actuele dreigingsinformatie, over hackers die al geruime tijd gerichte ransomware-aanvallen uitvoeren, gratis beschikbaar aan ziekenhuizen. Deze informatie, zogenoemde indicators of compromise, gaat over de belangrijkste criminele groeperingen en de methoden die zij gebruiken. Op basis van deze concrete technische informatie zijn ziekenhuizen beter in staat om cybercriminelen vroegtijdig uit kritieke infrastructuren te weren en te detecteren.
Een consortium van IBM, Amazon Web Services, Google Cloud, Microsoft en het Amerikaanse Departement of Energy stellen rekenkracht beschikbaar in de strijd tegen corona. 330 petaflops, 775.000 cpu-cores en 34.000 gpu’s moeten bijdragen aan de snellere vondst van een oplossing in de crisis. De eerste resultaten zijn er al; er zijn 77 chemicaliën geïdentificeerd die de stekels van het Covid-19 virus, de zogenaamde corona’s onschadelijk zouden kunnen maken.
Pandemic analytics en digitale besluiten
Data analytics, kunstmatige intelligentie (ai) en machine learning worden steeds belangrijker om publieke gezondheidsrisico’s te monitoren. Er zijn tegenwoordig gigantische hoeveelheden data beschikbaar, maar het kost simpelweg te veel tijd om dat door mensen te laten analyseren. Kunstmatige intelligentie biedt de mogelijkheid om met de inzet van die data verbanden tussen ziektes en trends te leggen, die zelfs de meest ervaren medische specialisten niet direct zien. Volgens Mark Lambrecht, director Global Health and LifeSciences Practice bij SAS, kunnen deze technologieën bijvoorbeeld helpen de vroegste stadia van uitbraken van besmettelijke ziekten te signaleren en verdere verspreiding, zoals bij het coronavirus, tegen te gaan. Hij ziet hierbij drie datatrends.
Gemeenten, provincies en waterschappen kunnen binnenkort digitaal besluiten nemen. Het was wettelijk nog niet mogelijk bestuurlijke knopen door te hakken zonder dat iedereen fysiek aanwezig is. De noodwet hiervoor van het kabinet moet nog wel worden goedgekeurd door de Raad van State, de Tweede Kamer en de Eerste Kamer. Eerder pleitte gemeenteraadsleden al voor het digitaal nemen van besluiten.
De data uitagenda
- Gezocht: ai-tool in data mining
Op Twitter heeft Marion Koopmans een opvallende oproep gedaan; zij zoekt data scientists die in staat zijn om met text mining aan de slag te gaan. Tijdens de corona-epidimie probeerde zij op Pubmed relevante artikelen te vinden, maar dat lukte niet door de aanhoudende stroom aan columns en brieven. Graag zou ze in samenwerking ai-tools ontwikkelen om makkelijker relevante content te kunnen vinden in deze enorme brei aan informatie. (Marion Koopmans, Twitter) - Hackathon: verantwoord omgaan met data tijdens corona
Er is een mooie corona-gerelateerde hackathon opgezet waarbij de nadruk ligt op ethiek en verantwoord omgaan met gegevens van gebruikers. ‘De Covid-19-pandemie laat realtime zien waarom de samenleving een schaalbare, ethische technologie-infrastructuur moet hebben’, aldus xLab-directeur Youngjin op ComputerWeekly. Deze hackathon brengt mensen samen die dit complexe en snel veranderende probleem het hoofd kunnen bieden. - The Digital Dutch goes Digital (KPN)
Het zou eerst fysiek bij Jaarbeurs in Utrecht gaan plaatsvinden, maar door de coronamaatregelen was dat niet meer mogelijk. Toch gaat het evenement The Digital Dutch van KPN door en hoe kan het ook anders, dit gebeurt digitaal. Op donderdag 23 april, van 14.00 tot 15.00 uur vindt er vanuit Jaarbeurs een online uitzending plaats met inspiratie en inzichten die organisaties en bedrijven verder helpen. Het zal vooral gaan over digitale communicatie en online samenwerking. Hoe we met elkaar vitale infrastructuren in Nederland draaiend houden. En hoe we waken voor onze digitale veiligheid. Via de KPN-website kan voor deelname worden ingeschreven. - Amsterdam Data Science-webinar
Een ADS-sessie over fairness: met wat voor potentieel schadelijke resultaten worden we geconfronteerd bij het gebruik van ai-gestuurde applicaties voor het nemen van beslissingen met een hoge inzet? Hoe kunnen we ervoor zorgen dat deze applicaties niet schadelijk zijn voor de burger? Welke waarborgen kunnen worden getroffen om eerlijke resultaten te garanderen? Jeroen Silvis, lead data scientist bij de gemeente Amsterdam, gaat in op deze moeilijke uitdagingen. - Remote Pizza Data
Python Pizza is een microconferentie georganiseerd door de Python Community. En dit is echt een speciale editie, het coronavirus maakt deze miniconferentie digitaal. Daarnaast hebben de organisatoren besloten om iets terug te geven: alle opbrengsten gaan naar Artsen Zonder Grenzen. Aanmelden kan via Christian Barra.