YouTube-video’s over AI-training: Apple Intelligence zonder gegevens van “The Pile”

YouTube-video’s over AI-training: Apple Intelligence zonder gegevens van “The Pile”

Apple Intelligence was niet getraind in de gratis database The Pile, die ondertitels bevat voor duizenden YouTube-video’s zonder verzoek van de makers ervan. Dat maakte het bedrijf bekend op Apple blog 9to5Mac. Het bedrijf had in een wetenschappelijk artikel over zijn hoogefficiënte modellen in de OpenELM-serie geschreven dat de dataset werd gebruikt. OpenELM is echter precies dat Het maakt geen deel uit van de kunstmatige intelligentiesystemen die het bedrijf gebruiktinclusief Apple Intelligence of andere machine learning-technologieën.

advertentie

Volgens de 9to5Mac-website Apple zei dat het OpenELM heeft ontwikkeld als een bijdrage aan AI-onderzoek en de ontwikkeling van open source-taalmodellen. Het bedrijf omschreef de technologie destijds als een ‘state-of-the-art open taalmodel’. OpenELM is echter uitsluitend ontwikkeld voor onderzoeksdoeleinden en niet om inlichtingenfuncties voor Apple aan te drijven. OpenELM bestaat nog steeds Op de AI-onderzoekswebsite van Apple beschikbaar.

Er is kritiek op de trainingsdataset “The Pile”, die afkomstig is van de non-profitorganisatie EleutherAI In een rapport van The Proof Dienovereenkomstig gebruiken ook andere grote bedrijven zoals Nvidia, Anthropic en Salesforce de informatie. Het zou onder andere een “hoop” moeten zijn Met ondertiteling voor 170.000 YouTube-video’s Ik ben gevoed. Er wordt gezegd dat hiervoor geen goedkeuring was.

Het is nog steeds onduidelijk wat en hoeveel trainingsgegevens Apple precies gebruikt voor Apple Intelligence. Het bedrijf stelt alleen dat het gebruik maakt van ‘gelicentieerde inhoud, inclusief gegevens die specifieke functionaliteit verbeteren’. Er zijn echter ook gegevens die Apple zelf lijkt te hebben verkregen van het openbare internet met behulp van zijn eigen webcrawler.

READ  Mozilla Thunderbird 102: gratis e-mailclient ondersteunt Matrix in de toekomst

Om zich af te melden, moeten website-exploitanten een privé-Applebot Extended opdracht geven hun inhoud te negeren. AppleBot schrijft dat het crawlen van websites door AppleBot (die niet voor AI-doeleinden wordt gebruikt, maar voor andere diensten) blijft bestaan, zelfs na opt-out, als dit niet tegelijkertijd wordt afgewezen in het bestand “robots.txt”. Het bedrijf bevindt zich op Apple.com. Het is ook bekend dat de groep de persoonlijke gegevens van gebruikers of “gebruikersinteracties” niet opneemt in de training. Er zijn ook filters voor creditcardgegevens of ‘obsceniteit’, evenals inhoud van lage kwaliteit – hoewel het onduidelijk is hoe deze worden uitgesloten.




(Bachelor)

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *