AI summer course: Dit model voorspelt de time series het beste

12-08-19 / Vivienne Haring

Het AI summer course team van Solid Professionals bestaande uit Consultants en Young Professionals die dagelijks werken aan het vergroten van hun AI kennisAfgelopen vrijdag was de laatste dag van de AI Summer Course. Het doel van de summer course was het voorspellen van een time-series. Zoals in de vorige blog beschreven, bestond de data uit yield curves van de afgelopen 15 jaar. Deze curves zijn moeilijk te voorspellen, omdat er heel veel willekeurigheid in zit. In de vier vrijdagen van de summer course hebben consultants samen met young professionals drie verschillende modellen gebouwd om te kijken welke het beste een yield curve kan voorspellen.

Model 1: SARIMA model

Het eerste model dat gebouwd werd was een SARIMA (seasonal auto regressive integrated moving average) model. Dit model probeert op basis van de voorgaande datapunten een voorspelling te maken voor de toekomst. De auto regressive component maakt een regressie op basis van de voorgaande datapunten. De moving average component neemt een gemiddelde van de voorgaande data punten. De integrated component gebruikt het verschil tussen de datapunten om een betere voorspelling te kunnen maken. De seasonal component voegt een seizoensgebonden trend toe. Zoals elk model heeft ook dit model parameters die aangepast kunnen worden. Door middel van een grid search wordt bepaald wat de optimale parameters zijn voor dit model.

Model 2: Tree-based model

Het tweede model dat gebouwd werd was een tree-based model. Dit wordt niet zo snel gebruikt voor time-series, maar wij waren erg benieuwd wat eruit zou komen. We hebben een random forest gebruikt. Hierbij worden er meerdere beslissingsbomen aangemaakt en probeert het model op basis van deze beslissingsbomen het volgende datapunt te voorspellen.

Model 3: Recurrent neural network

Het laatste model dat gebouwd werd was een recurrent neural network. Dit is gelijk het meest gecompliceerde model. Een recurrent neural network kan namelijk leren om de geschiedenis te onthouden. Hierdoor kan hij betere voorspellingen maken voor de toekomst. Een neuraal netwerk heeft heel veel parameters die getuned kunnen worden.

Uiteindelijk hebben we alle modellen met elkaar vergeleken en bleek het recurrent neural network het beste te werken. Dit hadden we ook verwacht, want dit model kan de meest gecompliceerde verbanden leggen. Daarna was het tree-based model het beste, wat enigszins verassend was, aangezien dit model niet vaak voor time-series gebruikt wordt. Wel leuk om te zien dat dit soort modellen dus ook redelijk kunnen werken. Om de modellen nog beter te maken kunnen we meer tijd stoppen in het zoeken van de optimale parameters. Daarnaast kunnen we ook nog externe data toevoegen, zodat we niet alleen hoeven te voorspellen op voorgaande datapunten van de yield curves. Dit zouden mooie vervolg stappen zijn.

2 Young Professionals van Solif Professionals die hun certificaat hebben ontvangen voor het succesvol afronden van de AI Summer course.Aan het einde van de middag hebben we de resultaten van de afgelopen 4 weken met onze kantoormedewerkers gedeeld en hebben twee van onze Young Professionals een certificaat ontvangen. Daarna hebben we met een glas champagne terug gekeken op een geslaagde AI summer course!

Deel: