Gegevens best passende lijnen: overmatige precisie is schadelijk
Alle afleveringen van zijn wekelijkse column, die elke zondag verschijnt, zijn hier te bekijken.
Als ik mijn temperatuurgegevens daadwerkelijk zou analyseren op de hierboven beschreven manier, zou ik eigenlijk een functie kunnen vinden die die dataset perfect beschrijft – maar ik zou hoogstens uitspraken kunnen doen over de temperatuur gemeten door mijn weerstation in een specifieke situatie ( mijn balkon) (en alleen tijdens de periode waarop de gegevens betrekking hebben). Hieruit kunnen geen algemene conclusies worden getrokken.
Het probleem waar we hier mee te maken hebben, wordt “uitrusten” of “uitrusten” genoemd. polynoom van graad N als principe N coëfficiënt + 1, dus er zijn verschillende parameters die ik kan wijzigen totdat de formule exact overeenkomt met mijn gegevens. Maar juist omdat alles zo perfect opgemaakt is, weet ik zeker dat de formule voor geen enkele andere dataset meer te gebruiken is. Bovendien zou het heel verrassend zijn als twee weerstations exact dezelfde gegevens zouden kunnen meten, zelfs als ze vlak naast elkaar zouden staan.
We hebben geen AI nodig die denkt dat hij slimmer is dan hij is
Als u openbare verbindingen wilt vinden, moet u proberen het met zo min mogelijk vrij te kiezen parameters uit te voeren. Bovendien kan de ware natuurwet nooit echte meetpunten en waarnemingsgegevens reproduceren, omdat alle metingen onvermijdelijk onderhevig zijn aan fouten. Perfecte overeenstemming met het interpolatiepolynoom is dus precies het tegenovergestelde van wat we zoeken. In plaats van de onderliggende relaties tussen de data te vinden, werd de formule precies aangepast aan de verkeerde meetwaarden – zo werden deze fouten in het model verwerkt.
“Analist. Schepper. Zombiefanaat. Fervente reisjunkie. Popcultuurexpert. Alcoholfan.”