Microsoft heeft op Azure een versie van ChatGPT gelanceerd die het ondernemingen mogelijk maakt data lokaal binnen de muren van hun eigen netwerk te houden. Deze 'enterprise'-versie is bedoeld voor grotere bedrijven die bang zijn voor het weglekken van vertrouwelijke gegevens en data waarop intellectuele eigendomsrechten rusten.
Sommige werkgevers verbieden hun personeel ChatGPT te gebruiken uit vrees dat bedrijfsgeheimen zo in verkeerde handen terecht kunnen komen. Samsung, Apple en veel Amerikaanse banken, waaronder JPMorgan, Bank of America en Citigroup, kennen om deze reden vergaande restricties dan wel een compleet verbod.
Ook is er een groep bedrijven die worstelt met het stellen van regels voor het gebruik van ChatGPT en het toezicht daarop. Maar de praktijk leert dat medewerkers altijd een manier weten te vinden om deze verboden of andere maatregelen te omzeilen. Een nadelig gevolg van beperkingen op het gebruik is dat medewerkers straks achter gaan lopen en minder productief worden. ChatGPT is onder meer in staat is om blokken code te corrigeren en te bewerken.
Privédienst
Microsoft stelt op GitHub dat Azure ChatGPT precies dezelfde gebruikservaring biedt als ChatGPT maar werkt als een soort privédienst. Extra waarde ontstaat door gebruik van eigen interne databronnen. Bovendien zijn plug-ins te gebruiken door integratie met interne diensten zoals ServiceNow. Microsoft heeft een Solution Accelerator gebouwd om het personeel gemakkelijker te maken bij allerlei werkzaamheden Azure ChatGPT te gebruiken.
Microsoft heeft ook bekendgemaakt dat Llama, het opensource-taalmodel van Facebook-moeder Meta, beschikbaar komt op Azure. Microsoft wil hiermee voorkomen dat grote cloudproviders zoals AWS en Google zich kunnen onderscheiden als neutrale platforms.
Klinkt sympathiek. Ik ervaar dat de chatbots op het gebied van COBOL vooral onzin verkondigen. Dus zou ik wel eens interactief met wat van die chatbots aan de gang willen gaan, om er wat kennis in te stoppen. Die optie ben ik nog niet tegengekomen. Er wordt gesteld dat er weinig COBOL beschikbaar zou zijn op Internet. Als ik alleen al naar de IBM manuals en redbooks kijk, zie ik genoeg. Het ware handig als je de manuals met een hogere mate van belangrijkheid als kennis kunt invoeren. IBM manuals zijn heel erg goed. Het gebruikelijke voorbehoud bij kennis van het internet in het algemeen, hoef je dan niet te maken. Beter dat je die manuals als een soort van absolute waarheid als kennis kunt opvoeren.
Tot nu toe nog niets compileerbaars uit de chatbots zien komen, als het om COBOL gaat. Integendeel. Chatbots zijn in staat om stukjes javascript aan het COBOL toe te voegen, dat dus niet compileerbaar is. Merkwaardig dat dit gebeurt.
Mijn reacties kunnen dan ook mooi als absolute waarheid opgevoerd worden. Mijn reacties “zijn heel erg goed. Het gebruikelijke voorbehoud bij kennis van het internet in het algemeen, hoef je dan niet te maken.” 😉
En voor Rusland https://www.ad.nl/buitenland/russische-schooljeugd-krijgt-nieuw-lesboek-poetin-redt-de-russen~a5468f01/
Bij IBM kunnen we wellicht binnenkort lezen om welke redenen RedHat gedwongen werd met opensource te stoppen.
Terug naar het artikel. Krijgen we straks een soort CompuServe ChatGPT ?
Op zich zal die chatbot nog wel gelijk kunnen hebben. Ondanks dat COBOL nog steeds ruim in de top 10 van gebruikte talen staat zal daarvan maar weinig op internet (open Source) te vinden zijn. Zeker als je het vergelijkt met de C, Python of java programma’s. De belangrijkste reden daarvoor is dat veel code in-house code is en dus niet vrij beschikbaar. Daarnaast zijn er maar weinigen die COBOL gebruiken voor een project op hun PC.
Het is altijd de vraag wat de training dataset is, en wat de waarde is die aan bepaalde data wordt toegekend. Bijvoorbeeld, welke waarde wordt toegekend aan een COBOL manual (die al jaren oud is) ten opzichte van een C, Python of java manual die veel recenter is. Zeker als je dat dan ook nog eens koppelt aan de hoeveelheid OSS projecten in een bepaalde taal.
Andersom geldt trouwens ook. Google hecht een bepaalde waarde aan een website, bijvoorbeeld hoeveel ernaar wordt verwezen of hoeveel reacties een bericht heeft gekregen. Daarmee kan een oude website een hogere ranking krijgen dan een nieuwe, zelfs al is die nieuwe pagina veel beter (voortschrijdend inzicht). Probeer maar eens de nieuwste adviezen te krijgen voor TLS protocollen, pagina’s die een 1024 RSA meer dan voldoende achten of een Elliptic Curve cipher zonde van de overhead vinden, zijn beter te vinden dan de (nieuwste) eisen zoals geformuleerd door bijv. het NCSC.
Wat betreft het lezen van de handleidingen moet ik zeggen dat de Redbooks van IBM aanzienlijk toegankelijker zijn dan de documentatie van een gemiddeld open source project. Misschien komt dat door de supportkosten want er is uiteindelijk meer dan het schrijven van de code. Naïviteit over de commercie van de code gaat tenslotte om de OpEx van het onderhoud welke door een goede documentatie eenvoudiger overdraagbaar wordt.
Memo over stoppen met open source door Red Hat heb ik gemist waardoor sommige reacties meer een mening zijn dan een feit. Berry slaat hierin de spijker op zijn kop want in-house coding is technisch gezien evengoed open source alleen is de IP niet openbaar. Dit geldt ook voor veel OSS projecten als ik kijk naar alle licentiemodellen, de verplichting tot delen is niet vanzelfsprekend.
Het lezen van de voorwaarden kost net zoveel tijd als het lezen van de handleiding en dan heb ik het nog niet over het schrijven ervan want abstracte dingen begrijpbaar maken is niet zo eenvoudig. Auteursrecht is juridisch geen exacte wetenschap want grutten in de opslag gaat om moderne datasynthese die me aan de diversiteit van de Big Data hype doet denken als gevolg van een diversiteit in koppelvlakken, high performance fileservices gaan meer om de metadata dan de datablokken zelf.
Het ordenen van informatie gaat om het indexeren en classificeren want terughoudendheid van banken aangaande bedrijfsgeheimen gaat meer om de processen dan de data, zie uitvoerige rapport van AIVD over bedrijfsspionage.
@Oudlid, Sinds de overname van RedHat door IBM is aangekondigd dat de source niet meer standaard beschikbaar gaat worden, daar is een (betaalde) licentie voor nodig. En klanten mogen deze source vervolgens niet publiceren onder deze licentie. Er is een discussie of RedHat/IBM daarmee mogelijk de GPL overtreedt. Het is in elk geval slecht nieuws voor de meeste RedHat clones.
Zie bijv https://www.theregister.com/2023/06/23/red_hat_centos_move/ (2020: IBM stopt de support voor CentOS. 2021: Nieuwe clones, zoals AlmaLinux en Rocky Linux komen beschikbaar. 2023: IBM sluit de source voor niet betalende klanten, lees RH clones.)
RedHat/IBM blijft dus wel gebruik maken van open source maar de source van RedHat wordt niet meer vrij beschikbaar. Het is een beetje krom, “There is no free lunch”, nu ja, niet voor de RH klanten dan want RH zelf blijft wel het Open Source brood aanbieden.
Berry,
Dank voor de link maar ik lees het enigszins anders want leesbare code is gezien de voorwaarden in een licentie niet gelijk aan vrij te distribueren code. De grote vraag over een open source filosofie aangaande het staan op de schouders van reuzen gaat om ongelijkwaardige wederkerigheid van redistributie versus de reciprociteit van een community.
Slecht nieuws voor de downstream freeloaders maar zoals ik in 2014 al schreef verandert de windrichting door de cloud want IP-rechten gaan niet alleen om de broncode.
“Microsoft heeft ook bekendgemaakt dat Llama, het opensource-taalmodel van Facebook-moeder Meta, beschikbaar komt op Azure”
Hmm, wel interessant als ik dit lees:
https://www.itworldcanada.com/post/metas-llama-2-license-falls-short-of-open-source-definition#
Azure zou je ook als een dienst kunnen omschrijven en als ik zie welke organisaties allemaal Microsoft 365 en daarmee Azure gebruiken….