Wat kan je wel en niet doen met Telraam-gegevens?

Data • Geschreven door Kris Vanherle op 10 May 2023

De interpretatie van gegevens is belangrijk, en daarom geloven wij dat er een groot potentieel schuilt in een citizen science-benadering van het verzamelen van verkeersgegevens. Niet alleen zijn burgers gemotiveerd om de gegevens te verzamelen en te beoordelen, maar ze kunnen ook lokale kennis en ervaring leveren om de zo belangrijke context toe te voegen. Ik hoop dat deze blogpost wat inzicht geeft in wat je kunt doen met Telraam-gegevens.

Als je de trotse eigenaar bent van een Telraam-toestel, de originele op Raspberry Pi gebaseerde "V1"-sensor is of onze gloednieuwe speciaal gebouwde S2-sensor, heb je jezelf waarschijnlijk afgevraagd: "OK, ik heb maanden en maanden Telraam-gegevens voor mijn straat, wat nu?".



Risico's en beloningen

In deze blogpost zal ik proberen enig inzicht te verschaffen welke gegevensanalyses je kunt doen met verkeerstelgegevens, in het bijzonder met het type gegevens dat een Telraam-sensor produceert. Aangezien Telraam "geboren" is bij Transport & Mobility Leuven, een groep verkeersingenieurs gespecialiseerd in de analyse van verkeersgegevens, weten we welke waarde Telraam-gegevens kunnen opleveren, maar ook wat de risico's zijn als je de beperkingen van ruwe verkeerstelgegevens "overinterpreteert" of negeert.

Zoals met elke technologie is Telraam niet "perfect", dus zijn Telraam-gegevens ook niet perfect. Momenteel schatten wij de nauwkeurigheid van gemotoriseerde verkeerstellingen op 90-95% (voor S2) of 85-90% (voor V1). Voor fietsen/voetgangers is de nauwkeurigheid lager - zelfs op geschikte locaties -, terwijl de V1-sensor vatbaarder is voor misclassificatie. De nieuwe S2-sensor is nauwkeuriger voor fietsen/voetgangers (+/- 80-85%) met een veel kleiner risico van verkeerde classificatie (bv. een groep fietsen geteld als een auto).

Het bijzondere van de Telraam-gegevens is dat ze over een lange periode zijn gegenereerd. Verkeerstellingen zijn meestal beperkt in de tijd, bijvoorbeeld met behulp van pneumatische buizen of tijdelijke camerasystemen (LIDAR, ANPR) gedurende een periode van slechts een paar weken, of nog beperkter, handmatige tellingen gedurende slechts een paar uur. Alleen al de hoeveelheid gegevens die je met een Telraam-sensor verzamelt, is een troef op zich. Als je de gegevens bekijkt, moet je die troef optimaal benutten. 

Hieronder laat ik zien hoe je dat doet, met 3 voorbeelden van wat je met een Telraam-gegevens kunt doen.

Voorbeeld 1: Tijdreeksen

Grafiek van gegevens over een lange periode

In een tijdreeksanalyse plot je het volume auto's/fietsen/voetgangers (Y-as) tegenover de tijd (X-as). Dit is een gemakkelijk te genereren en te begrijpen grafiek. Toch is het belangrijk een paar dingen in gedachten te houden.

Ten eerste: plot dit NIET voor dagtotalen met Telraam-gegevens. Overweeg even waarom...






Hint: Telraam genereert (nu en in het verleden) alleen gegevens als het licht is. 

Hier in België is er ongeveer 6 uur daglicht verschil tussen winter en zomer, dus als je dagelijkse totalen gaat plotten, zul je grote seizoensgebonden verschillen zien, wat niet nuttig is, of erger nog, kan leiden tot misleidende informatie over trends in het verkeer. Wat is dan beter? Je kunt totalen per uur uitzetten, om het feit te omzeilen dat er in de winter minder uren met gegevens zijn dan in de zomer, gemakkelijk! Toch moet je voorzichtig zijn, want in de (diepe) winter mis je misschien gegevens over de drukste piekuren. De veiligste aanpak is om alleen die uren te selecteren waarvoor het hele jaar gegevens zijn.

Wat kun je nu leren uit zo'n grafiek? Uit bovenstaand voorbeeld, dat in feite het Telraam-toestel is dat actief is in het kantoor van de Belgische premier (I kid you not) in de Wetstraat, kun je "in één oogopslag" een paar dingen leren. Het autoverkeer is min of meer stabiel gebleven, met minder verkeer tijdens de kerstvakantie. Het tweewielerverkeer trok echter aan in augustus en later. Er is ook een interessante piek eind augustus/begin september.

Dit type grafiek is nuttig om:

  • Te zien welke tijdframes interessant zijn om dieper te onderzoeken
  • Snel overzicht van "gebeurtenissen" in de gegevens te krijgen, met korte of lange periodes van atypische hoge/lage verkeersvolumes
  • Het identificeren van specifieke tijdsintervallen waarop je jouw analyse wilt richten. Je zult tijdsperioden zien met hiaten in de gegevens (bv. sensor was tijdelijk offline) of periodes waarvan uje weet dat ze om welke reden dan ook niet representatief zijn, willen negeren.


Voorbeeld 2: Typische volumes

Dit is het type analyse waarin de gegevens van Telraam uitblinken. Selecteer een (lang) interval, en bepaal het "typische" verkeerspatroon voor deze periode. Hier zijn 2 voorbeelden van een typische (werk)dag links en een typische week rechts. Neem voor het typische dagprofiel de mediaan (niet het gemiddelde, ik leg later uit waarom) voor elk uur van een werkdag, voor een periode van 2 maanden. Er zijn ongeveer 40 niet-weekenddagen in 2 maanden, dus heb je 40 datapunten voor elk uur van de dag. Het verkeer zal enigszins fluctueren, maar met 40 datapunten heb je genoeg gegevens om te bepalen wat typisch is voor elk uur. 

De mediaan is de middelste waarde als je de gegevens rangschikt van klein naar groot, zodat je automatisch uitschieters en atypische verkeersvolumes in die periode buiten beschouwing laat. De mediaan is beter dan het gemiddelde, omdat de mediaan de typische waarde naar boven (of beneden) kan verdraaien als je een of meer uren hebt met waanzinnig hoge (of lage) verkeersvolumes. 

Het credo hier is: hoe meer gegevens, hoe beter. Hoe langer het tijdsinterval dat je kiest om uw typische volumes te bepalen, hoe stabieler en representatiever het is voor uw straat. Er is echter geen "gouden standaard" hiervoor. Eventuele schommelingen in de verkeerspatronen worden verborgen binnen de periode die gekozen is. Als je bijvoorbeeld een periode van 1 mei tot 1 augustus kiest om een typisch patroon af te leiden, dan werk je met gegevens van 3 maanden (goed), maar je voegt ook een maand zomervakantie (juli) met 2 "gewone" maanden (mei en juni). Zou je het resulterende verkeerspatroon echt "typisch" noemen?...

In de verkeerskunde zijn de meest "normale" maanden om het typische verkeer te bepalen meestal maart/april/mei/juni en september/oktober/november. December/januari/juli/augustus zijn niet typisch vanwege de feestdagen. Welke periode representatief is, hangt sterk af van de context. Bijvoorbeeld, bouwwerkzaamheden kunnen het verkeer sterk beïnvloeden en je wilt geen periode kiezen waarin iets is gebeurd dat de typische verkeerspatronen beïnvloedt... 

... of, misschien is dat precies wat je wilt doen? In sommige gevallen is dat inderdaad precies wat je wilt doen, dus laten we het doen!


Voorbeeld 3: Periodes vergelijken

Dus, voortbouwend op typische profielen - hetzij een typische dag (met verkeersvolume per uur) of een typische week (met verkeersvolume per dag), kun je ook het typische verkeer voor verschillende periodes vergelijken. Dit type analyse is uiterst nuttig als je wilt weten of een - al dan niet geplande - ingreep of gebeurtenis een systematische wijziging van het verkeersvolume veroorzaakt. 

Doelgerichte maatregelen, zoals de invoering van een nieuw fietspad of een toegangsbeperking, zijn specifiek gericht op een systematische verandering van de verkeerspatronen. Als je wilt weten of die interventie systematisch effectief is, moet je lange tijd meten om te zien of de typische verkeerspatronen (systematisch) anders zijn in de periode vóór vs. de periode na de interventie.

Hier gelden dezelfde "regels" als in het vorige voorbeeld. Je moet een representatieve periode hebben. Merk op dat je niet noodzakelijk precies dezelfde periode nodig hebt voor de vergelijking; je kunt 3 maanden gegevens nemen om uw "basislijn" typisch verkeerspatroon te bepalen en die vergelijken met 1 maand gegevens om het typische verkeerspatroon na de interventie te bepalen. Dat laatste is net iets onzekerder om inderdaad als "typisch" te worden bestempeld. Ook neemt het zijn tijd voordat verkeerspatronen zich aanpassen aan een nieuwe situatie, dus wil je een periode die lang genoeg is om uitspraken te kunnen doen over een nieuw typisch verkeerspatroon. Het kiezen van de juiste tijdsintervallen is geen exacte wetenschap.

Nu, als je eenmaal 2 periodes met typisch verkeer hebt, is de vraag, hoe herken je een significante verandering in het verkeerspatroon? 

In de inleiding merkten we op dat de nauwkeurigheid van Telraam niet 100% is. Je kunt zich dus afvragen of je überhaupt iets kunt beweren als typische verkeersvolumes, neem 10%, verschillen voor/na een ingreep, voor een apparaat met een nauwkeurigheid van 85-90%? De hoeveelheid gegevens van Telraam is hier de belangrijkste troef. Ten eerste is een incidentele telfout, om welke reden dan ook, geen probleem als je met typische verkeerspatronen werkt. Typisch verkeer is stabiel, niet beïnvloed door incidentele fouten, maar kan toch gevoelig zijn voor systematische fouten. Maar omdat de systematische fout voor en na de ingreep dezelfde is, zijn beide typische patronen nog steeds goed vergelijkbaar!

Dit gezegd zijnde, zal er altijd -enige- variatie zijn in het verkeersvolume, dus het is nog steeds moeilijk te beweren dat de verkeerspatronen systematisch zijn veranderd. Hoeveel verandering zou duiden op een significante, systematische verandering? 

In het voorbeeld hierboven zetten we het typische autoverkeer (linker figuur) en tweewielers (rechter figuur) uit voor 2 periodes, voor een typische maandag (volle lijn) en een typische zaterdag (stippellijn). Uiteraard zijn de patronen niet -exact- hetzelfde, maar wel min of meer. Aanwijzingen voor een statistisch significant verschil tussen de 2 perioden zouden kloppen als de vorm van het patroon voor beide perioden hetzelfde zou zijn, terwijl de volumes voor elk uur in de ene periode hoger/lager zijn dan in de andere. In dit voorbeeld zien we niet echt een verschil tussen de 2 periodes, behalve voor het tweewielerverkeer in de namiddag. Er is een duidelijk verschil van ongeveer 100 km/h tussen 15.00-18.00 uur. Een andere aanwijzing is dat deze waarneming geldt voor zowel maandag (volle lijn) als zaterdag (stippellijn), hetgeen nog een aanwijzing is dat hier wel degelijk iets aan de hand is. Uit deze vergelijking kan worden afgeleid dat het tweewielerverkeer systematisch is toegenomen vanaf (in dit geval) 27 september.



Conclusie

De boodschap van deze blogpost is om aan te moedigen uw gegevens een verhaal te laten vertellen en daarbij om een gezonde mate van voorzichtigheid te betrachten bij de interpretatie van die gegevens. 

Je zult alert moeten zijn op de context achter de verschijnselen die je in de gegevens waarneemt. Die context is belangrijk. Is wat je denkt te zien echt waar? Bijvoorbeeld, kan een toename van het fietsverkeer zijn omdat er een nieuw fietspad is... of omdat het weer de laatste tijd veel beter is?

Gegevens hebben hun beperkingen, daarom verkies ik de term "data-informed" boven de meer gebruikte term "data-driven". Laat die gegevens je niet op een dwaalspoor brengen! 

Er zullen fouten zijn. Er wordt niemand beter van om te doen alsof die er niet zijn. Bij Telraam kiezen we ervoor om sensorfouten niet te verbergen of te maskeren, en presenteren we je de ruwe gegevens. We maken de gegevens ook 'open', zodat iedereen er zijn eigen interpretatie aan kan geven.

De interpretatie van gegevens is belangrijk, en daarom geloven wij dat er een groot potentieel schuilt in een citizen science-benadering van het verzamelen van verkeersgegevens. Niet alleen zijn burgers gemotiveerd om de gegevens te verzamelen en te beoordelen, maar ze kunnen ook lokale kennis en ervaring leveren om de zo belangrijke context toe te voegen.

Ik hoop dat deze blogpost wat inzicht geeft in wat je kunt doen met Telraam-gegevens. Deel zeker je verhalen, ervaringen en vragen met de Telraam-community!


(Deze cijfers zijn gemaakt met behulp van het "stratenblad" van Telraam. Deze functionaliteit is een geautomatiseerde analyse die beschikbaar is voor Telraam-toestellen die deel uitmaken van een project, in een professioneel netwerk. Wij zijn van plan deze functies in de nabije toekomst ook voor individuele gebruikers te ontsluiten. U kunt al deze grafieken genereren vanaf de detailpagina per segment, of uw gegevens downloaden en verwerken in Excel)