De podcast De Dataloog van 14 mei zit bomvol met artificial intelligence. Zo is de winnaar van het AI Songfestival bekend, gaan we in op Nederlandse en Europese ai-plannen, kijken we hoe ai onderzoek naar glaucomprogressie ondersteunt en behandelen we algoritmische systemen en hun effectbeoordelingen. Ook ontbreekt het cloud- en securitynieuws niet, net als de Data-uitagenda. Jurjen Helmus van de Hogeschool van Amsterdam, Walter van der Scheer van GoDataDriven en Computable-hoofdredacteur Sander Hulsman lieten dit en ander datanieuws van de afgelopen weken de revue passeren.
Het had in Nederland hét muziekevenement van het jaar moeten worden, maar corona gooide roet in het eten: het Eurovisie Songfestival. VPRO bedacht een alternatief en organiseerde een songfestival op basis van artificial intelligence. Dertien teams uit Europese landen en Australië deden mee en het was precies dat laatste land dat met het liedje Beautiful the World won. De Nederlandse inzendingen eindigden op de derde en vijfde plaats. Van de muziek is een Spotify-lijst gemaakt, de uitzending is ook terug te kijken op Youtube.
(Tekst gaat verder onder de video)
Artificial temperature
De toepassing van data en ai in de zorg is sinds Covid-19 nog duidelijker geworden dan ooit tevoren. Daarom heeft de Nederlandse overheid een website ontwikkeld om zorgprofessionals te helpen met het gebruik van data en ai in hun werk. Zo is de website uitgerust met een Wegwijzer AI en komen er zorgprofessionals aan het woord over hoe zij de toegevoegde waarde van ai hebben ervaren in de zorg die zij verlenen.
Temperatuur is een persoonsgegeven en mag niet zomaar worden gemeten of opgeslagen. Waarnemen mag wel. Dit heeft de Autoriteit Persoonsgegevens (AP) geoordeeld. Werkgevers die de lichaamstemperatuur van hun werknemers opmeten voordat zij naar binnen mogen of de temperatuur meten van hun bezoekers, mag dus niet zomaar. Deze organisaties zijn in overtreding en riskeren daarmee een hoge boete.
Ai-plannen NL en EU
Het Nederlandse Strategisch Actieplan AI houdt bovengemiddeld rekening met mensenrechten, in vergelijking met nationale ai-strategieën elders in de wereld. Volgens onderzoekers van Stanford University behoren we zelfs tot de koplopers. In een nieuwe studie namen de Amerikaanse onderzoekers 29 nationale ai-strategieën onder de loep. In dergelijke strategieën leggen regeringen vast hoe zij ai willen reguleren en innovatie met ai willen ondersteunen.
Nederland zet vraagtekens bij het streven van de Europese Commissie naar twee ecosystemen op basis van ai. De Europese Commissie werkt allereerst aan een zogenaamd ecosysteem van excellentie ter ondersteuning van de ontwikkeling en acceptatie van ai in de EU. Een tweede ecosysteem moet fungeren als een regelgevend raamwerk voor betrouwbare ai dat burgers beschermt en bijdraagt aan een sterke Europese data-economie. Nederland heeft twijfels over de plannen en heeft zes voorwaarden gedefinieerd.
NL-startups en quantum
De overheid zou volgens de Dutch Startup Association 1,6 miljard euro moeten investeren in het startup-ecosysteem. Op die manier vallen de startende organisaties niet om tijdens de coronacrisis. Dit met het doel het investeringsklimaat van Nederland aan te wakkeren, als land te blijven innoveren en om de economie van de toekomst veilig te stellen.
Bij de TU Delft zijn ze al een tijdje bezig om een quantum-computer te ontwikkelen in het door Microsoft gefinancierde lab. Helaas blijkt nu dat de resultaten van een onderzoek uit 2018 niet correct zijn.
Lekken (vinden)
Wil je als data scientist of hacker nog wat geld bijverdienen? Dat kan. De drie maanden durende Azure Sphere bug-bounty challenge biedt topbeloningen voor het compromitteren van Pluton of Secure World binnen de iot-beveiligingssuite van Microsoft. Microsoft heeft een bug-bounty-programma gelanceerd voor zijn Azure Sphere-aanbod, een beveiligingssuite voor het internet der dingen die hardware-, besturingssysteem- en cloud-elementen omvat. De hoogste beloning is honderdduizend dollar.
Een masterstudent van de TU/e heeft cruciale fouten ontdekt in de beveiliging van Thunderbolt, een populaire technologie van Intel om snel gegevens van en naar een computer over te brengen. Björn Ruytenberg vond zeven beveiligingslekken in het ontwerp van Thunderbolt en ontwikkelde negen realistische scenario’s (onder de noemer Thunderspy) hoe iemand met kwade bedoelingen die kan uitbuiten.
CSR en Tesla
De meet- en regelsystemen van vitale infrastructuur, zoals energiedistributie en drinkwaterreiniging, zijn onvoldoende beschermd tegen digitale dreigingen. De cyberweerbaarheid moet beter en organisaties moeten hierbij beter worden ondersteund. Dat concludeert de Cyber Security Raad (CSR). Volgens deze raad is er werk aan de winkel om zogeheten industrial automation & control systems in de vitale infrastructuur op orde te krijgen. Gebeurt dat niet, dan dreigt een maatschappelijke ontwrichting bij systeemverstoringen.
Tesla loopt op vele manieren voor op andere autofabrikanten, waaronder het belichten van de focus en veiligheid van de bestuurder via de Autopilot-functie. Tesla’s verzamelde autonomie-dataset is echt uniek en sommige autofabrikanten zijn bang dat ze zo ver achter Tesla staan in r&d dat het inhalen een lange, inspannende en mogelijk nutteloze race zal worden. Eén van die partijen is Volkswagen.
Maatschappelijke impact ai
Een nieuw rapport van het Ada Lovelace Institute en Data Kind UK verduidelijkt de voorwaarden rond algoritmische audits en effectbeoordelingen, en de huidige stand van onderzoek en praktijk. Naarmate algoritmische systemen in veel delen van de samenleving kritischer worden voor besluitvorming, is er steeds meer belangstelling voor hoe ze kunnen worden onderzocht en beoordeeld op maatschappelijke impact en naleving van wet- en regelgeving.
Een nieuwe test kan glaucoomprogressie achttien maanden eerder detecteren dan de huidige gouden standaardmethode, volgens de resultaten van een door de UCL gesponsorde klinische studie. Glaucoom is een oogziekte waarbij de oogzenuw beschadigt. De technologie, ondersteund door een ai -algoritme, zou kunnen helpen bij het versnellen van klinische proeven en kan uiteindelijk worden gebruikt voor detectie en diagnostiek. De test gaat ook worden ingezet voor patiënten met longziekten, onder wie coronalijders met ademhalingsproblemen.
Dataiku en Watercloud
Dataiku komt elk jaar met een aanpassing en uitbreiding van zijn Technoslavia-kaart. Deze kaart maakt de versnippering van technologie inzichtelijk in het datalandschap. In 2020 wordt er specifiek ingezoomd op de gefragmenteerde wereld van data-infrastructuren.
Nederland waterland en Nederland cloudland. Dat lijkt wellicht een groot verschil maar toch staat dit dicht bij elkaar. Door gebruik te maken van elkaars data en modellen kunnen waterprofessionals in Nederland beter hun werk doen en de totstandkoming en uitvoering van waterbeleid versnellen. Dat is de conclusie van de zogenoemde Watercloudvisie, opgesteld door een consortium van partijen uit de watersector, onder leiding van Royal HaskoningDHV, in opdracht van Rijkswaterstaat.
Nerdnieuws
- Nieuwe features in R 4.0
Er zijn nieuwe features in R 4.0. stringsAsFactors = FALSE standaard is een van de belangrijkste functies die in deze versie zijn bijgewerkt. Volgens een blogpost heeft R sinds zijn oprichting, in ieder geval standaard, tekenreeksen geconverteerd naar factoren bij het maken van gegevensframes rechtstreeks met data.frame () of als resultaat van het gebruik van read.table () varianten om te lezen in tabelgegevens. Maar vanaf nu converteert R 4.0 standaard niet langer strings naar factoren in aanroepen naar data.frame () en read.table ().
Onder deze nieuwe versie moet een gebruiker de packages opnieuw installeren om bij te werken naar de nieuwe versie. Een aantal pakketten is afhankelijk van het vorige gedrag, dus ze zullen het dienovereenkomstig moeten bijwerken en opnieuw installeren. - Dplyr-update voor R
Wat Pandas is voor Python is Dplyr voor R. Sterker nog, veel mensen kunnen beter in Dplyr coderen dan in R-base. Dat is hoe centraal Dplyr is geworden in het R-ecosysteem, samen met de andere pakketten die momenteel de tidyverse vormen. Dplyr 1.0.0 is uit en dat is een mijlpaal. De tidyselect-helperfuncties kun je nu gebruiken binnen bepaalde dplyr-werkwoorden. Bijvoorbeeld:
mtcars %>%
select(starts_with(“c”)) %>%
head(3) - De relocate ()-functie
Vaak willen mensen een specifieke volgorde voor de kolommen in hun dataframe, en voorheen was de enige manier om dat te doen, de kolommen binnen een select () werkwoord te ordenen, en dat was vervelend als er veel kolommen bij betrokken waren. Standaard verplaatst verplaatsing de kolom of kolommen naar links van het dataframe. Verplaatsen naar een specifieke plaats kan door de argumenten .before of .after te gebruiken. - De summarise-functie
Het originele werkpaard van Dplyr is in deze nieuwe release nog flexibeler gemaakt. Ten eerste kan het nu vectoren retourneren om meerdere rijen in de uitvoer te vormen. Ten tweede kan het dataframes retourneren om meerdere rijen en kolommen in de uitvoer te vormen. Als je een functie wilt samenvatten die een vector uitvoer creëert, is dit nu eenvoudig. Je kunt bijvoorbeeld eenvoudig een bereik samenvatten. - Pivot wider
Je kent het wel, dat je een summary maakt en je die eigenlijk snel in kolommen wilt hebben. Dat kan nu in één setje code.
De Data-uitagenda
- Webinar Social Distancing
Hot ITem organiseert voor dinsdag 26 mei 2020 van 11.00 tot 12.00 uur een webinar over Social Distancing. Sprekers Raymond van Ek, Adam Knoop en Adil Bohoudi behandelen de vraag ‘Hoe bestuur je 1,5 meter in een continu veranderende organisatie?’. Dit webinar is interessant voor zowel business als IT-management. In dit webinar wordt ingegaan op de uitdagingen, het implementeren van een social distancing-protocol, hoe om te gaan met privacy-issues en hoe iot en analytics-modellen bijdragen aan de veiligheid. (Hot ITem) - Zelf kunst maken in R
Heb je als data scientist nu even niets te doen, dan zou je bijvoorbeeld kunst kunnen maken in R met behulp van randomizers in R. Danielle Navarro is een computational cognitive scientist en associate professor aan de University of New South Wales. Haar onderzoek richt zich op het leren en redeneren van menselijke concepten en op statistische methoden in de gedragswetenschappen. Andere onderwerpen die ze heeft onderzocht, zijn besluitvorming, taal- en culturele evolutie, cognitieve ontwikkeling en forensische psychologie. Ze heeft ook een specifieke package gemaakt voor haar kunstwerken. (DJ Navarro en Github) - Solving Together 2020 van Google
Op 26 mei 2020 deelt Google in deze conferentie waardevolle leerlessen en oplossingen die het zelf is tegengekomen. Deze conferentie is bedoeld voor organisaties die aan het herstellen zijn, organisaties die transformeren en organisaties die aan hun toekomst aan het bouwen zijn. (Google) - Documentaire Data Science Pioneers
Data Science Pioneers – Conquering the next frontier is de eerste documentaire over en met data scientists en is een hele week ook beschikbaar om thuis te bekijken. De documentaire werd tot op heden alleen vertoond in groepsverband tijdens verschillende meetups. Dataiku, initiatiefnemer van Data Science Pioneers, maakt het voor iedereen mogelijk om de documentaire volgende week thuis te streamen. (Dataiku) - AI Friday for Manufacturing
Voor de moderne fabrikant zijn gegevens verenigd en alomtegenwoordig geworden in de hele organisatie, van supply chain management tot de productieactiviteiten, en het is een van de meest waardevolle activa in elke industriële operatie. Er zijn drie hoofdgebieden waar fabrikanten in ai in investeren: de smart factory, duurzaamheid en workforce-transformatie. Als je verantwoordelijk bent voor fabrieksactiviteiten, supply chain, veiligheid van werknemers of buitendienst, dan ben je 29 mei van 9.00 tot 12.00 uur welkom om deel te nemen aan AI Friday for Manufacturing. (Microsoft)