Letošní zimní počasí se mi vůbec nelíbí. Nostalgicky vzpomínám na to, kdy naposledy ležel sníh déle než pár dní. Poslední slušná zima byla v roce 2011. Když se dívám na průběh letošního počasí, často se ptám, jestli se počasí ještě tuto zimu umoudří, nebo jestli zima skončí tak smutně jak začala. A protože mou profesí i koníčkem je analytika, rozhodl jsem se odpovědět si na tuto otázku s pomocí historických dat.
Nebudu fušovat do řemesla meteorologům a předpovídat počasí na příští týden. Nebudu si ani hrát na klimatologa a potvrzovat či vyvracet hypotézu o globálním oteplování. Můj zájem míří někde mezi do dosud málo prozkoumané oblasti výhledu vývoje počasí na několik příštích měsíců. Přesněji řečeno, moje otázka zní: dá se z vývoje teplot letošního podzimu a začátku zimy usuzovat na teplotní průběh zbývající části zimy? Jsou v zásadě tři možnosti, jak to může dopadnout:
- Existuje negativní korelace a konec zimy bude svým chladnějším průběhem kompenzovat extrémně teplý začátek – můžeme se těšit na sníh v lednu a v únorů.
- O dalším průběhu zimy se nedá vůbec nic říct, protože neexistuje žádná korelace mezi začátkem zimy a koncem zimy.
- Existuje pozitivní korelace a zima skončí stejně teplým počasím jakým začala.
Moje srdce si přálo, aby to byla možnost 1, můj mozek a paměť se obávala, že to bude něco mezi 2 a 3. Pojďme se podívat, jak je to tedy je.
Pro svou analýzu jsem použil historická data z klimatologické databáze GHCN. Obsahuje denní časové řady meteorologických pozorování ze zhruba deseti tisíc stanic po celém světě za období několika desítek až stovek let. Každá stanice má jinou délku historie – například slavná stanice v pražském Klementinu měří už od roku 1775. Tato data jsou tak obrovská, že jsem použil službu Google BigQuery a vytáhnul jsem si data pro českou republiku z cloudu. Google totiž tuto databázi vystavil jako jeden z mnoha demo datasetů na https://bigquery.cloud.google.com/table/bigquery-samples:weather_geo.gsod. Bohužel uříznul nejnovější historii a data končí rokem 2011, no co se dá dělat. Protože počasí nezná geografické hranice, je poměrně hloupé omezovat se pouze na stanice na území ČR. Já jsem vzal všech 296 meteorologických stanic vzdálených do 300km od geografického středu ČR, který leží v obci Číhošť na Havlíčkobrodsku na souřadnicích (49.74375, 15.338639), pro zájemce viz http://www.turistika.cz/mista/geograficky-stred-cr. Pro mou analýzu postačují měsíční data, tak jsem si s pomocí BigQuery připravil měsíční průměrné teploty pro celou dostupnou historii měření a získal tak dataset o přijatelné velikosti 70 tisíc řádků. Pro každý měsíc jsem si spočítal odchylku, tj. o kolik stupňů Celsia byl teplotně nadprůměrný nebo podprůměrný.
Pak už zbývalo jen změřit korelaci mezi teplotními odchylkami podzimu a začátku zimy na jedné straně a koncem zimy na straně druhé. Známá historie (podzim a začátek zimy) pro mě byly měsíce září až prosinec, neznámá budoucnost pak leden a únor (konec zimy).
Už Vás nebudu dále napínat. Korelace vyšla +0.27. Co to znamená? Znamená to, že se potvrdilo to, čeho jsem se obával. Korelace je pozitivní, to znamená že teplý začátek zimy předpovídá i teplý konec. Stejně tak chladný začátek zimy je často následován i chladným koncem zimy. Zároveň tato korelace není příliš silná, takže tato předpověď není příliš spolehlivá. Jinými slovy bylo víc zim, kdy toto pravidlo platilo, ale byly i takové, kdy to neplatilo. Na obrázku jsou proti sobě vykresleny jednotlivé odchylky v různých letech a na různých stanicích.
Pro nás je zajímavá pravá polovina grafu, protože začátek zimy 2016 byl teplotně značně nadprůměrný (odchylka_09_12 má kladnou hodnotu). Body v pravém horním kvadrantu odpovídají zimám, které začaly stejně jako ta letošní teple, a teple také skončily. Naproti tomu body v pravém dolním kvadrantu představují zimy co teple začaly, ale skončily chladně. Vidíme tam výrazně roky 1940 a 1956, z novější historie potom rok 2010. Nic naplat – těch bodů nahoře je prostě víc a tak korelace +0.27 předpovídá spíše teplý zbytek zimy. Šance, že se letos dočkáme sněhu, však přesto je. Naději nám dává již zmíněný rok 2010. Pro lepší přehlednost jsem ještě zprůměroval odchylky za jednotlivé stanice (odchylky v mém kruhu o průměru 600km se zas tolik nelišily) a vykreslil jsem je do stejného grafu za jednotlivé roky.
Na něm je vidět, že i v roce 2006 a 2009 začala zima špatně a nakonec skončila dobře. Dlužno však říct, že letošní zima je zatím tak extrémně teplá, že se podobá spíše nechvalně známé zimě 2007, která vévodí pravému hornímu kvadrantu.
Zkusil jsem odhadnout prediktivní model na konec zimy (leden-únor) na základě historie září-prosinec, ale slabý výsledek. Dále jsem zkusil posunout se na konec ledna a s historií září-leden predikovat únor, případně únor-březen. Korelace byla +0.30, resp. +0.35, tedy opět kladná a trochu silnější, byť stále velmi slabá. V tomto směru tedy k žádnému překvapení nedošlo, ale alespoň máme dobrý pocit, že jsme prozkoumali všechny možnosti.
Bude tedy letos ještě zima? Já osobně si tipuji spíše smutný a blátivý konec zimy 2016 se sněhem pouze na horách, kde ho bude nedostatek. Velmi rád bych se mýlil.