Två olika modeller för prognostisering av avloppsvattenflödet baserat på tidsserieanalys testades med indata under ett år med bra resultat och med en belysning av för- och nackdelar med modellerna.
Av: Bengt Andersson
Inkommande avloppsvattenflöde är en viktig parameter för driften av ett avloppsreningsverk och det kan även vara en hjälp för att identifiera kapacitetsproblem eller behov av utveckling av existerande infrastruktur. Prognosmodeller för flödet baserade på simuleringar av ledningsnätet har utvecklats tidigare men sådana modeller har flera begränsningar vad gäller de fysikaliska processer som påverkar flödet som t.ex. regn, snösmältning, infiltration och avrinning. Därför har datadrivna tekniker utvecklats för simulering med ansatser som autoregressiva modeller (AR), artificiella neurala nätverk (ANN), genetiska algoritmer och multivariat analys.
Syfte med refererad studie var att utveckla en tidsseriemodell (ARIMA, autoregressive integrated moving averages) och en ANN-modell (MLPNN, multilayer perceptron neural network) för prognostisering av inkommande flöde. Modellerna tillämpades för Barrie Wastewater Treatment Facility (WwTF) i Canada. I studien ingick att analysera tidsmönstret för avloppsvattenflödet, att utveckla en ARIMA-modell för prognostisering av dagligt inflöde till reningsverket i Barrie samt att utveckla en MLPNN-modell för jämförelse med den föreslagna ARIMA-modellen.
Modellerna och utvärderingen
ARIMA-modellen är uppbyggd av tre komponenter, AR-, MA- och I-kompententerna. AR-komponenten bygger på att varje observation är en linjär kombination av tidigare observationer samt en slumpfelskomponent. MA-komponenten bygger på glidande medelvärden och indikerar att varje observation är en linjär kombination av tidigare felkomponenter samt en slumpfelskomponent. I-komponenten används för att hantera icke-stationära tidsserier genom en differentieringsprocess. Modellen betecknas ofta ARIMA(p,d,q), där parametrarna är positiva heltal där p är antalet tidssteg för AR, d är antalet differentieringar och q är ordningen för glidande medelvärden.
ANN-modellen består av flera beräkningselement (artificiella neuroner), som har sorterats i lager med ett lager för indata, ett eller flera lager för dolda noder för beräkningar och ett lager för utdata. Modellen måste tränas innan användningen.
Modelleringens noggrannhet utvärderades genom RMSE (root mean square error), MAPE (mean absolute percentage error), R2 (coefficient of determination) och NSE (Nash-Sutclif efficiency). En bra modell har låga RMSE- och MAPE-värden, ett R2-värde nära 1 och ett NSE-värde nära 1 och större än 0.
Genomförande
City of Barrie har cirka 900 km2 yta och en befolkning på drygt 140 000 personer. Spillvatten- och dagvattensystemen är separerade. Det finns drygt 530 km ledningar för spillvatten, 9 km tryckavloppsledningar, 15 aktiva pumpstationer och ett avloppsreningsverk. Dimensionerande flöde till reningsverket är 76 000 m3/d och maxflödet 156 000 m3/d.
Inkommande flöde mättes som 15-minutersvärden och studien pågick mellan den 1 november 2015 och den 31 oktober 2016. Dagliga meteorologiska data insamlades från Environment Canada samt från två meteorologiska stationer nära avloppsreningsverket. Avvikande mätdata eliminerades för att förbättra datakvaliteten genom användning av känd robust teknik. 0,28 % av alla data utgjordes av avvikande mätdata fördelat på 0,59, 0,44, 0,08 resp. 0,00 % för vår, sommar, höst och vinter
Resultat
En karakterisering av avloppsvattenflödet baserat på 15-minutersvärden under hela perioden visade att medelflödet varierade mellan 1 056 och 4 206 m3/h med ett tydligt mönster under dygnet. Flödet var störst under mars och april och lägst under oktober. Dygnsmönstret skilde mellan vardagar och helgdagar. Flödesmönstret överensstämde väl med vattenanvändningen.
Vid konfigurationen av ARIMA-modellen konstaterades att tidsserien inte var stationär och en differentiering erfordrades. Efter en differentiering låg autokorrelationsfunktionerna inom konfidensintervallet, vilket indikerade att tidsserien var stationär och att d-värdet för modellen blev 1. En jämförelse av olika kombinationer av modellparametrar i modellen med p-värde mellan 0 och 6 och med q-värde mellan 0 och 3 gjordes dels för en träningsperiod med 66 % av data dels för en testperiod med återstående 34 % av data. En modell ARIMA (5,1,1) för träningsperioden hade lägst RMSE och högst NSE jämfört med andra modellkombinationer. En validering av modellen med data från testperioden visade en god överensstämmelse mellan uppmätta och simulerade data. Kvarstående fel var normalfördelade med ett medelvärde mycket nära 0. Modellen kunde därför användas för att analysera inkommande avloppsvattenflöde till reningsverket.
En tre lagers MLPNN-modell användes i studien för jämförelse med 21 indatavariabler (föregående flöde, regn, snö, snö på mark, ackumulerat regn, veckodag och lufttemperatur), 20 beräkningsnoder och en utdataparameter. Utvärdering av modellen visade ungefär samma noggrannhet som ARIMA-modellen med en god överensstämmelse mellan uppmätta och simulerade data.
Modellerna kunde användas för prognostisering av flödet. ARIMA-modellen hade lägre värden för RMSE och MAPE och högre värde för NSE, vilket indikerade att modellen var bättre att prognostisera flödet även om skillnaden var liten. ARIMA-modellen använder endast flödesdata och det krävs stationära tidsserier. MLPNN-modellen kräver inte stationära serier och externa variabler kan inkluderas medan datakvaliteten är avgörande.
Slutsatser
En utvärdering av två modeller för prognostisering av avloppsvattenflödet till ett reningsverk visade att
- båda modellerna kunde prognostisera avloppsvattenflödet med bra resultat
- ARIMA-modellen gav något bättre prognoser än MPLNN-modellen
- ARIMA-modellen kräver stationära tidsserier för att fungera med erforderlig sekventiering
- MPLNN-modellen påverkas starkt av datakvantitet och -kvalitet
Källa: Q. Zhang, Z. Li, S. Snowling, A. Siam, W. El-Dakhakhni. Predictive models for wastewater flow forecasting based on time series analysis and artificial neural network. Water Science & Technology 2019, 80.2, pp 243 – 253.
Hela artikeln från Water Science & Technology finns att läsa gratis här.