Internet Vandaag | Bnr

OpenAI gebruikte (of: misbruikte?) YouTube om AI-model GPT-4 te trainen

Informações:

Synopsis

OpenAI, de maker van ChatGPT, heeft miljoenen uren aan video's op YouTube gebruikt om eigen AI-taalmodellen te trainen. Joe van Burik legt in deze Tech Update uit wat er is gebeurt. OpenAI heeft al eind 2021 (een jaar voor de lancering van ChatGPT, dus) volop YouTube-video's gebruikt om AI-taalmodel GPT-4 te trainen. Dat schrijft The New York Times. Dat deed de start-up die vooral gesteund wordt door Microsoft door hun eigen AI-systeem voor audiotranscriptie te ontwikkelen, Whisper genaamd. Door al die audio van video's op het videoplatform van Google om te zetten in tekst, konden ze het gebruiken. Maar juridisch gezien is dat schimmig, want mogelijk mag dat niet. Hoewel Google zelf ook AI-taalmodellen trainen met behulp van video's, doet het dat naar eigen zeggen conform overeenkomsten met makers van video's. Al heeft Google daarvoor volgens de New York Times nog de voorwaarden aangepast in 2023. Google zegt in een reactie tegen The Verge dat het ook daadwerkelijk activiteit van OpenAI op de systemen heeft g