Tag Archives: Данни

Спирам свалянето на данни за въздуха

от Боян Юруков
лиценз CC BY-SA

В последните почти петнадесет години съм отварял, визуализирал и анализирал доста данни. Една част от тях пускам в отворен формат, някои – в реално време. Едни такива данни бяха замерванията за въздуха в София. В началото на 2016-та година започнах да ги тегля със свой скрейпър, който интерпретираше графиките на общината и ги записваше в разбираем и отворен формат.

Това се случи във време, когато въпреки многобройните призиви и запитвания по ЗДОИ, ИАОС отказваше да публикува суровите данни от измерванията. Официалните данни бяха само от пет станции в София с ясна методология. Година по-късно се появиха първите частни станции, но данните от институциите все така бяха недостъпни. Затова данните отваряни в реално време от моя скрипт бяха използвани дълго време от няколко сайта и приложения като отправна точка.

Всичко това спря на 1-ви септември. Тогава съответните антични графики на общината спряха да работят и скриптовете се счупиха. Почти осем години по-късно слагам край на проекта и за това има няколко причини. Архивът му ще остане активен на този сайт.

Първо, след масиран натиск, но най-вече съвестни хора на ключови позиции в определени кабинети, които натискаха за прозрачност и дигитализация, ИАОС все пак публикува данните си. Това става в профила им в портала за отворени данни на кабинета.

Второ, покрай популярността на airbg Столична община подобри визуализацията на сайта си и данните са по-достъпни, включително от ИАОС. Добавиха и още станции в рамките на проекта AirThings, където има удобно api.

Трето, института Gates започна пилотен проект за следене на не само на замърсяването, но и на редица други параметри и проблеми от градската ни среда. Картата им може да намерите на сайта.

Всъщност, именно разговор с Петър от Gates днес на кошера на Тук-Там ме накара да погледна пак скриптовете и да забележа, че са спрели да работят също както и съобщенията за грешки. На практика голяма част от scraper-ите ми вървят от години без поддръжка или да им обръщам особено внимание. Това важи както за документите на институциите, така и за спиранията на ток, парно и вода в София, безследно изчезналите, строежите в София, производството на енергия и прочие.

За разлика от преди 8 години, днес има предостатъчно източници на данни за замърсяването. Това е резултат от инвестираното време, нерви и внимание на множество хора. Продуктът е огромно количество информация, което трябва да се превърне в ефективни политики базирани и оценени като ефект с данни.

Именно заради тази достъпност няма да обръщам внимание на Столична община, че им са се скапали графиките и ще спра скриптовете. В линковете горе ще намерите данните от другите източници.

Ето някои от статии по темата, които съм писал през годините:

The post Спирам свалянето на данни за въздуха first appeared on Блогът на Юруков.

Динко, неговите камиони и една спяща държавна машина

от Боян Юруков
лиценз CC BY-SA

Вчера стана ясно, че камион се е обърнал блокирайки магистрала Тракия в двете посоки. Тривиална вече за нашия информационен канал история, която иначе би се загубила в потокът жлъч, кръв и скандали. Нещо обаче в отразяването на подробностите около случая ме подразни и реших да потърся сам информация.

За 20-тина минути излязоха доста неща, които описах в пост в социалките. Поради интереса добавих още в коментарите. Ще ги събера тук накратко и ще добавя накрая къде може да се правят такива проверки, ако някой има интерес. Надявам се най-малкото в националните ни медиите да започнат да го правят, защото това, на което сме свидетели е трагично.


Вече беше обявено, че камионът е на Господин Вълев Вълев по известен като Динко. Не, нямам никакво уважение към човека, просто първото му име наистина е „Господин“. Твърди, че имало метал и камъни по пътя, което от АПИ отричат, но добавят, че камионът е с изтекъл технически преглед от април и гумите били изключително изтъркани.

Припомням, че камионът е спукал гума, което се случва лесно при неизправни, поправяни незаконно или просто изпилени гуми, още повече при съмнения за претоварен камион, в резултат на което няколко коли са пострадали, няколко души са в болница, но като по чудо няма жертви.

Ето какво научаваме от регистрите:

Фирмата му е разследвана за данъчни измами, има множество санкции за нарушения с разрешителните за управление на отпадъци и други проблеми покрай тях, включително за нерегламентирана площадка, пожари и прочие. Отделно имаше скандал преди две години, в които със схема трябваше да се продаде цялата въздушно-контактна и канална високоволтова мрежа на Градски транспорт Пловдив за скрап на неговата фирма. Процедурата беше спряна и уж материалите са в прокуратурата. Познайте къде залежават.

Последното разрешително за управление на отпадъци му е от юни. Разрешителното за транспорт обаче е от 13-ти април и включва седем камиона. Още едно разрешително има за други три камиона на другата си фирма. Сред първите е злополучният от днес явно с номер A1256HH. На него му е изтекъл техническия преглед три дни по-рано – на 10-ти април. На още четири от камионите са им изтекли между февруари 2022 и март 2023, но това не пречи явно да са в разрешителното. И така до днес. Не пречи също, че два от тях все още също нямат гражданска.

Впрочем три от същите камиони без технически преглед, включително двата без гражданска, са вписани като средства за извършване на пътна помощ към 20 юни 2023.

Отделно в някои медии го хвалят, че докарал „уникален за района“ камион, който да изгребе отпадъците. Не се вижда точният номер, но изглежда да е със смолянска регистрация. В разрешителните от различните инспекции на която и да от фирмите му липсва камион с близка до тази регистрация, който да има право да превозва отпадъци.

За последните две години камионите му са насъбрали 17 нарушения, за които дължи компенсаторни такси за над 11 хиляди лева. Някои от тях са от 2021-ва. Един от камионите му – У0049АТ, с изтекъл гтп през септември 2022-ра, има регистрирано нарушение, че е карал без маршрутна карта през април 2023-та. Т.е. доказано е карал без ГТП и преди. Отделно двата му камиона Волво, включително този, който се блъсна днес, освен, че са без гтп, нямат нито една маршрутна карта, т.е. тол такса за пътищата в последно време. Включително за днес. Това е още едно нарушение отгоре на другите и отново не е отчитано дълго време.

Горе виждате карта на всички места, където камионите на Динко са хващани между юли 2021 и юни 2023, че не си плащат тол таксите като хората. В червено са местата, където е хващан два пъти. В синьо са местата, където е карал без ГТП и тол такса. В данните липсват двете нарушения на камионът A1256HH, който най-вероятно се е обърнал днес, защото май не е на името на фирмите му. Поне така може да съдим по регистъра отказващ справка по ЕИК. Най-много установени нарушения има през 2022-ра – 10.


От къде научаваме всичко това:

The post Динко, неговите камиони и една спяща държавна машина first appeared on Блогът на Юруков.

За семейството, църквата и всичко останало само на база две числа

от Боян Юруков
лиценз CC BY-SA

Твърде много хора ми препратиха статията на Христо и Марин Генчеви в Гласове, за да се накарам да я прочета въпреки къде е публикувана.

Тестът е пълен с грешки и крещящо неразбиране на демографските процеси в последните 100 години. Та сипвам си чаша вино и описвам най-очевидните:

Оставям настрана съчиненията какво е направил Бисмарк през 1881 и най-вече защо, но обвързването на каквато и да е форма на социална система с намаляващата раждаемост е подвеждаща до абсурдна. Демографският преход е феномен наблюдаван във всички индустриални общества до ден днешен и идва скоро след урбанизация и специализиране на голяма част от обществото. Сещайте се за повече фабрики и офиси и по-малко земеделие и крехка самодостатъчност. Често идва след бум в раждаемостта причинена от напредъка медицината, някакво здравеопазване и сносна инфраструктура, която не позволява на 2 до 5 от 12-те раждания на жена в началото на 20-ти век да са мъртвородени, а още 4-5 да не доживеят до венчило. Това виждаме и в България.

Прескачат после към соца 80 години по-късно, но там социалните мерки като градини и ясли са въведени, защото са осъзнали, че имат нужда и от жените да работят във фабриките. В голяма степен факта, че се хвалим колко жени имаме в инженерните науки днес е страничен резултат от именно това.

Коефициентът на плодовитост не е среден брой на децата, които една жена има между 15 и 49 г. Да отворят методологията на НСИ най-малкото. Най-общо казано това е индекс показващ колко деца би имала една жена, ако решенията и възможностите ѝ да има деца съвпадаха през целия ѝ живота с тези на жени от различни възрасти родили през дадената година. С други думи едно поколение жени може да има през една година или период нисък коефициент и пак да има толкова деца, колкото родителите си, но просто по-късно – точно каквото наблюдаваме сега. И България се пише с „я“ накрая.

Спадът през 90-те беше продължение на тенденция започнала още 70-те на база отново главно урбанизацията и подобрено здравеопазване, но се задълбочи заради кризите, несигурността и пропадането именно на социалните системи, които описват.

Скокът до преди 15 години се захранваше отчасти с повишаващата се сигурност, но най-вече с решения за първо или следващи деца отлагани от 90-те в някои двойки. Тези сигнали се виждат ясно във възрастовото разпределение на родилките в този период и особено около 2009-та.

Скокът през 2022-ра на 1.78 е странен, но всъщност има просто обяснение – преброяването показа, че има по-малко жени в детеродна възраст. Следва да коригираме старите данни както се прави с оценката на населението след всяко преброяване. Така ще видим същото плавно покачване, както в последните 10 години.

Индексът на плодовитост е един фактор, но е безсмислен най-малкото без да смяташ средната възраст и относителния брой жени в детеродна възраст. Отделно за развитието на населението и повъзрастовата смъртност и демографския преход като цяло. Да не говорим за емиграцията и шовинизма ни, който в голяма степен спира така нужната ни имиграция, а в немалка степен – и емигрантите да се върнат.

Нищо от това няма общо с връщането към някакъв традиционализъм. Всъщност, нарастването на консервативни настроения в едно общество винаги съпровождат застаряването на това общество. Младите са тези, които носят промяна, готови са да поставят установеното под въпрос и да не се водят по предразсъдъците на родителите си. Всъщност, готовността на повече двойки да имат деца е въпреки това наблюдение и заради вече описаното икономическо развитие. Към него може да добавим и елементи като повече сигурност за майките, все повече гъвкавост в работното място, мобилност и покачващ се среден размер на жилищата в градовете.

Не на последно място – да гледаш единствено две точки в развитието на една метрика от многото определящи демографската ситуация и да вадиш генерални изводи за обществото, църквата и семейството не е нещо, което си заслужава сериозно внимание, но ей на – обърнах му някакво. 🍷

The post За семейството, църквата и всичко останало само на база две числа first appeared on Блогът на Юруков.

Емисиите докладвани от Ковачки в разбираем вид

от Боян Юруков
лиценз CC BY-SA

Покрай новината вчера, че европрокуратурата е влязла в ТЕЦ-овете и топлоцентралите свързвани с Ковачки заради измами и укриване на емисии, се сетих за инструмент, който пуснах преди повече от 9 години. Става въпрос за данните на ИАОС, които се подават всяка година от самите замърсяващи индустриални инсталации. Те се съхраняват от години в регистър на сайта им, който както се очаква е в доста труден за разбиране вид.

Затова бях направил интерактивен инструмент, с който да се преглеждат въпросните замърсители според категорията, собственика и прочие. Предвид, че съм го писал преди толкова години, видът не е особено добър и се разглежда удобно само на компютър. Ще се опитам в близките дни да го направя да се отваря прегледно и на телефон.

Последно бях обновявал данните с тези за 2018-ма. Снощи ги обнових до 2021-ва. От тези за 2022-ра само няколко площадки са подали информация. Ако не се лъжа, имат срок до средата на годината. В горната част се виждат бързи филтри за търсене на конкретни замърсители и замърсяващи. Добавих описаните в проверките на европрокурата и свързвани с Ковачки.

Интересното е, че се вижда колко много от замърсяването е изчислено, а не измерено. Всъщност, последно са измервали нещо в който и да е от ТЕЦ-овете му през 2016-та, а последното значимо измерване е имало през 2009-та. По практически всички показатели замърсяването на централите му намалява, с изключение на 2021-ва година, където има покачване. Това е вероятно заради увеличеното производство покрай високите цени на тока.

Показаните данни тук са единствено и само това, което Ковачки е декларирал пред агенцията за емисиите на централите му. Както многократно се коментираше, включително под статиите ми по темата, това е далеч от истината. За съжаление, родната прокуратура и надзорните органи прикриват всичко това години наред. Дори при нашумелите сигнали и проверки в последната година, Гешев не видя риск за хегемонията си, за да извади окото на гарвана. Наложи се Кьовеши да се намеси, за да се случи нещо, което показва отново защо ГЕРБ и Гешев имаха такъв отпор срещу институцията ѝ.

С тези уточнения, може да разгледате подробно данните в самия инструмент. Увеличавайки картата може да се фокусирате върху определени райони и инсталации. Върху всички графики и списъци има филтри. Избраното така съдържание може да се споделя, тъй като адреса на страницата се обновява всеки път. Ще пиша отново, когато обновената версия на графиката е готова.

The post Емисиите докладвани от Ковачки в разбираем вид first appeared on Блогът на Юруков.

Ранна карта на спиранията на тока в западна България

от Боян Юруков
лиценз CC BY-SA

Когато се опитвам да осмисля някакви данни, често прибягвам до бързи графики и карти, за да разбера измеренията, интересните аспекти или грешките в тях. За целта използвам инструменти като Mapbox, Carto, OpenRefine или дори Google Docs. Почти винаги тези карти биват бързо изстивани или остават за мен. Тук публикувам единствено тези, които са добре описани, документирани и лесни за употреба и разбиране. Сега искам да направя нещо различно

От повече от година събирам данните за спиранията на тока, парното и водата в София. За съжаление, има доста дупки в събирането по различни причини – от грешки в моя скрипт, до блокиране от страна на иначе публичните ресурси на съответните компании.

В последно време пак обърнах внимание специално на данните за тока и искам да ви покажа две такива карти. Първата е на София и показва всички трафопостове на ЧЕЗ/Електрохолд, за които е съобщено поне едно прекъсване на тока в последните 81 дни – от средата на ноември насам. Големината на балона показва колко спирания е имало – между 1 и 32. Цветът – колко сумарно време е нямало ток. В жълто е под два часа. Оранжево – под 12 часа, а в червено – повече от 12 часа.

Тук може би трябва да уточня, че това не са всички трафопостове в западна България, а само онези 4411 трафопоста в столицата, в които е имало поне пет минути спиране на тока за последните почти три месеца.

Следващата карта показва същите данни със същите условия за цветове и размер на точките, но за цялата западна България. Виждаме, че София е дори в добро положение в сравнение с други региони. Тази карта показва 15189 трафопоста.

Картите може да видите на нов прозорец тук за София и тук за западна България. Данните от тях може да свалите тук. Опитвам се да ги систематизирам в инструмент за лесен анализ и преглед, но не знам кога ще имам време. Пропуските в свалянето на данните също е проблем, но съм го оправим в момента. Друг проблем е, че не знаем колко абонати/жители са засегнати от спирането на тока във всеки един трафопост. Ще се опитам да получа тези данни от регулатора, тъй като Електрохолд е частно дружество и не отговаря по ЗДОИ. Все пак ще е интересно да се види как това качество на услугата влияе на хората.

The post Ранна карта на спиранията на тока в западна България first appeared on Блогът на Юруков.

Стопяващата се (драма за претопяването на българската) нация

от Боян Юруков
лиценз CC BY-SA

След излизането на първите данни на НСИ имаше, разбира се, много възгласи колко се е стопила нацията за последните 10 години. Намаление наистина има и то за съжаление е закономерно с процесите започнали още в края на 70-те задълбочени през 90-те и чиито ефекти виждаме ясно днес. Променената възрастова структура на хората имащи деца, многото деца родени и предимно оставащи в чужбина и повишената смъртност през пандемията влошават това положение.

Разбира се, има и много неразбиране на материята, което видяхме излязло на ярък гръмогласен парад през последните месеци. То включва теми като емиграция, раждаемост, смъртност и особено влиянието на сексуалното здраве, образование и абортите.

Затова надали може да се учудим на апокалиптичните сензационни заглавия. Това, което не видяхме обаче, са гръмките заглавия след като миналата седмица НСИ пусна данните за етническото разпределение от преброяването през 2021-ва. Вместо това се потвърди наблюдение базирано на данните от определени райони, което повтарям от години

С години се спекулираше много, включително колко коректен е въпроса и дори дали трябва да се позволява на хората да посочват какви са етнически – някои настояваха, че преброителите трябва да ги преценяват на око на какви им изглеждат с аргумента „ма то си е ясно“. Обсъждал съм нашироко в коментари тук абсурдността на тези и други твърдения. Трудно се говори по темата без да се зачекнат тезите така любими на по-крайно националистически настроените, но сериозно исторически необвързани наши сънародници. Затова искам да ви кажа, защо тези данни са всъщност също толкова тревожни, колкото и голяма част от резултатите от преброяването.

Това, което видяхме и което медиите единодушно решиха, че не си струва, защото не е скандална сензация, е че всъщност двете най-големи малцинствени групи в България намаляват. Наистина, цялото население намалява, но при етническите турци и роми това е много по-силно изразено. Докато при етническите българи намалението е – 9.6%, при определилите за етнически турци то е 13.6%, а при ромите е почти двойно – 18%. Така апокалиптичните прогнози през годините за „претопяване“ всъщност е с обратен знак – делът на ромското население е паднал с 8.5%, а на етническите българи се е увеличил.

Именно това обяснявам от години и срещам почти винаги насмешка – че емиграцията особено сред ромското население е значително по-голяма. Причините са както икономически, така социални, дискриминационни и дори корекционни. Немалко градове и села в страната ефективно са под контрола на местни феодали защитавани от прокуратура и политически сделки. Това важи с особена сила в Родопите. Сегрегацията и сериозната дискриминация на ромите специално пък създава реални пречки да се реализират. Това, както и особено силно изразената бедност в някои региони прави емиграцията единствен избор.

Докато един или повече от тези аргументи важи за повечето български граждани, вече имаме ясни данни доказващи нещо наблюдавано отдавна. Може би най-добре беше илюстрирано от човек, който срещнах докато бях доброволец при изборната секция във Франкфурт преди години. Заговорихме се докато чакаме за трудностите в Германия и отношението към чужденците като цяло. Беше от ромски произход и е работел като строител в България. Сподели, че „и в България се отнасят с мен като циганин, и в Германия се отнасят с мен като с циганин, но ми дават поне шанс да работя нещо смислено“. Към онзи момент имаше строителна фирма, осигуряваше хляб на 10 семейства и си плащаше данъците в Германия.

Примерите са най-шарени, също както емиграцията ни. Нагледал съм се на премного, но предпочитам да говоря за този феномен с данни. Факт е, че както при бежанците, пропускаме голям шанс да приобщим и да работим с всякакви общности и култури. Всичко това е заради някаква дълбока озлобеност и криворазбран модел за хомогенност, който не е съществувал до преди 3 поколения.

Затова нека не говорим по темата демография с емоции и усещания на база кой какво видял в коридор на болница или по някоя улица, а разбиране, че светът е доста по-сложен и шарен. Също и че сами си го причиняваме всичко това и не ни помага никак.

The post Стопяващата се (драма за претопяването на българската) нация first appeared on Блогът на Юруков.

Лечението на тежко болни деца – четири години без напредък

от Боян Юруков
лиценз CC BY-SA

Макар да изчезна от медийното внимание, не трябва да забравяме, че почти всеки ден деца биват диагностицирани с тежка болест и отговорността на обществото ни към тях не изчезва. Исторически това се правеше през фонда за лечение за деца, но в началото на 2019 години функциите ѝ бяха пренесени в НЗОК. Следя фонда и регистъра им отдавна, а след това въпреки опитите да се скрият данните, показах колко неподготвени бяха независимо от годините предполагаема подготовка. Това го забелязахме всички най-малкото по увеличените призиви за дарения за лечение зад граница в социални мрежи, кутии в магазини, SMS-и и платформи за дарения.

В предишната ми статия от юли 2021 показах последните изводи от тези данни. Няма да се впускам в детайлите от тогава – нещата и обясненията за аналогични и почти нищо не се е променило. Реших да обновя графиките с това, което са публикували от тогав. Нищо изглежда не се е променило в работата на НЗОК. Най-малкото докладите и регистърът са същите.

По броя подадени заявления се забелязва известно увеличение в последните 7 месеца. Не се вижда особена разлика в чакащите одобрение, но се запазва увеличеният брой отказани заявления, който се видя в края на 2020. Интересен е обаче резкият скок през март.

Едно положително нещо е, че изглежда леко намалява времето до решение. В следващата графика гледаме само тези с решение, а не всички подадени. Все пак се вижда, че в средата на годината пак отнема над три седмици да се стигне до някакъв резултат. При това времето, в което се чака мнение на експерти се увеличава и стига до над седмица средно.

Броят взети решения по месеци не се увеличават въпреки повечето заявления, особено в последно време. Необяснима е и голямата вариация, особено предвид големия иначе брой – по 100-150 на месец.

Следващата графика показва колко време са чакали хора за решение към момента на взимането му. Например, ако са получили одобрение през март 2022, то са чакали 14 дни за решение плюс 3 дни за експерти. През март 2021-ва обаче е било 24 дни за комисията плюс 3 дни за становище от експерти. През последните два месеца е над 20 дни за комисия и 13 дни за експерти. Така времето за чакане на заявленията решени след август се връща на нивата с огромните забавяния от началното фиаско със закриването на Фонда за лечение на деца през март 2019-та.

Броят дейности също расте значително. Тук отчитам не срокът или сложността им, а чистия брой. Виждаме доста повече искане на становище от експерти и епикризи, но по-малко писма за липсващи документи. Поне съдейки по информацията, която сами си отчитат в системата.

Тук отново виждаме броя заявления „отлежаващи“ на бюрото на НЗОК. Това са искания за често спешно лечение на тежко болни деца, които във всеки един момент чакат решение. В червено съм маркирал тези, които все пак ще получат такова до месец. С синьо са такива, които може и да не бъдат решени, но често получават отговор след 2-3 месеца.

След големия скок при прехвърлянето в НЗОК виждаме подобрение в началото на 2020-та причинено обаче изцяло от по-малкото подадени заявления покрай пандемията. Не заради друго, ами заради блокирането на здравната система. Значително подобрение има в края на 2021-ва и началото на 2022-ра, а в последните 6 месеца ситуацията се е влошила и по този показател до нивата от началото на 2019-та.

Отново предупреждавам, че тези числа и изводи се базират изцяло на публичния регистър, който НЗОК сам поддържа и въвежда като информация. Това са данните, които всеки от тези хиляди родители виждат за своите деца. Аз само ги обобщавам, за да намеря тенденции. Доколко НЗОК въвежда коректно дати и информация е невъзможно да се провери.

Като цяло от тези числа може да си направим няколко извода. Първият е, че качеството на работата е непостоянно и има силни вариации както в работата на експертите, така и в бързината на взимане на решения. Докато няма еднакви случаи и е очаквано някои да се бавят повече от други, при толкова много документи трудно е да се приеме друго обяснение освен общо забавяне.

Собствените им отчети показват и друга притеснителна тенденция, която беше отбелязана вече от други в последните години – рязко пренасочване на средства към български болници. При това оправданията им за по-ниски цени и нуждата от добри специалисти у нас бързо бяха развенчани в увеличените средства непропорционално на случаите, както и лошата успеваемост, особено при определени лекари.

За съжаление, НЗОК по този, както и по много други показатели като електронни услуги и намаляване на бюрократичната тежест, остава далеч на опашката на българската администрация. Нещо, което не следва да се приема просто така предвид какъв огромен ресурс разпределят и колко ключова роля имат в обществения живот.

The post Лечението на тежко болни деца – четири години без напредък first appeared on Блогът на Юруков.

Данните на Call.Sofia в разбираем и удобен вид

от Боян Юруков
лиценз CC BY-SA

Община София има портал за сигнали и жалби, в който всеки жител или гост на града може да съобщи за проблем – call.sofia.bg. Използвам го активно още преди да се преместя от Франкфурт в София и като замисъл го намирам за добра идея. Самият сайт не е особено добър от гледна точка на използваемост, но по-важното е, че практически всички сигнали се разпределят на районните кметове, които често нямат ресурс или дори право да ги решат.

Подбуден от типично българския ни цинизъм, исках да видя, дали сигнали от сайта изчезват. Повод за това беше наблюдението, че на началната страница се виждат само последните 5000. Затова както с документите на Направление архитектура и градоустройство, написах скрипт, който през час да тегли най-новите сигнали. Тъй като исках да видя къде е имало исторически най-много проблеми, изтеглих всичко назад във времето заедно с обновленията и геометриите. Почти всички сигнали имат посочено местоположение като точка, но някои хора си правят труда да отбелязват пътища и цял регион.

Така се оказа, че имам всичките им данни и мога най-малкото да вадя статистика. Като например брой сигнали със статус приключен – 13%. Повечето сигнали – 77% – получават едно или повече уведомления без да са отбелязани като приключени. Историята на статусите пък ми позволи да видя за колко време отнема от подаването до последното обновление по сигнал. 11% отнемат повече от месец. Също така през работните дни се подават два пъти повече сигнали отколкото през почивните, а в петък – с 10% по-малко от предходните четири дни. Най-много сигнали има за пътна инфраструктура – 28%. На второ място с над два пъти по-малко сигнали е паркирането с 12%. Едва тогава следва замърсяването с 10%, сметоизвозването и осветлението с по 9%.

За да осмисля обаче данните географски и да мога да ги прехвърлям в реално време, имах нужда от инструмент. Затова малко по-малко създадох интерактивна карта, която да показва като колони броя на случаите. Колоните са с основа 50 на 50 метра, а всеки случай добавя около 2 метра над височината им. Има филтри, с които да се избират конкретни данни по години или друг период, категории и прочие. Натискайки на дадена колона ще видите списък с всички сигнали на това място с линове към оригиналния сигнал. Списъкът със сигналите на даденото място, както и панелът с филтрите може да се скриват. Вдясно под бутоните за увеличение на картата има бутон за показване отново на филтрите. Бутонът под него е за промяна на прозрачността на триизмерната визуализация върху картата. Полезно е, ако искате да се ориентирате по-добре за улиците под въпросните колони.

След обратна връзка от Linkedin и кмета на Слатина Георги Илиев добавих няколко неща, включително филтър по райони, за да може да се сравни активността и случаите разпределени там. Може също да се превключва показване на абсолютен брой сигнали, както и спрямо населението на региона. Границите и оценката за населението на последните взех от отворените данни на практически закритата вече Софияплан.

Преди обаче да погледнем самите данни, както винаги следва да поговорим за условностите им. Както при Фонда за лечение на деца поет в последствие от НЗОК, тук също показват единствено това, което се поддържа като масив от данни от СО. Има сигнали с автоматично добавен маркер на мястото на Софийска община. Тях съм ги скрил от картата, например. Има и такива добавени с други общини и области. Има сигнали със сбъркана година в датите, както и понякога с десетки пъти изпратен един и същ сигнал за едно и също нещо. Има също много тестови сигнали използвани видимо за проверка на нови категории и функции.

Активността по сигналите идват най-вече от районните кметства, почти винаги под формата на сканирани и прикачени писма. Рядко се случва да добавят изрични коментари – най-вече при отхвърляне на сигнал. Тук е важно да се разбере, че получен отговор или дори „приключен“ сигнал не означава, че даденият проблем е решен. Това може да се декларира дори в приложените документи, но дори тогава няма някаква форма на проверка или потвърждение. Системата не позволява последващи коментари или обновления или дори съгласие с изпратения статус или информация. Връзката е еднопосочна.

По подадените сигнали може да съдим най-вече за активността по теми, райони и конкретни места. Именно тук визуалното представяне на информацията помага най-много. Докато самата карта на call.sofia да показва някаква форма на групиране по клъстъри, то не позволява откриване на „горещи точки“. Всъщност, използват точно същото групиране в картите си преди единадесет години. Основният проблем обаче е, че показват само активните сигнали, т.е. тези, на които не е отговорено, а се очаква разглеждане. Освен, ако един по един не разглеждаме десетките хиляди преди това познавайки поредните им уникални номера, няма да знаем къде е имало голям интерес към даден проблем. Именно това направих.

Единственото, което може да ни покажат тези данни обаче е точно това – активност, интерес и някаква форма на доверие, че нещо може да се случи по дадената тема, та дори това да е само публичност. Повечето сигнали не означават непременно повече проблем, а наболял такъв, активна група граждани на това място или голям трафик от хора. В централната част на града минават най-много хора и очаквано има повече активност.

Това, което не се забелязва е значимо увеличение на активността през годините. След очаквано ниската активност през 2020-та, има едва леко покачване през 2021-ва, също както предходните две. Излизат между 54 и 60 хиляди сигнала на година, което изглежда много докато не сметнем, че става въпрос за 164 сигнала дневно в град с два милиона жители и ужасна инфраструктура.

Видимо липсва, е двустранна комуникация, прозрачност какво се случва и какво се планира, както и оценка на свършеното от подалите сигнала и живеещите в региона. Това неизменно се обвързва с липсата на самостоятелност при голяма част от решенията и бюджетите на районните кметства, както и абсурдното управление на градското планиране във всичките му аспекти.

Независимо, подаването на сигнали има голямо значение, защото постигат публичност на конкретни проблеми. Отваряйки данните на този портал постигаме и донякъде прозрачност на историята на тези проблеми и натрупването им. Картата, която направих, е пример как следва гражданите да използват отворените данни на администрацията, а защо не и частни организации. За разлика от първата ми визуализация за българчетата родени в чужбина или тази на активните българи зад граница, тази за сигналите в София може да се използва за реално изследване на данните.

Разбира се, както с НАГ и доста други ведомства, обсъжданите данни въобще не са изначално отворени, така че се наложи да ги отворим през публичните им API-та. Това не прави инструмента call.sofia по-малко полезен, а просто морално остарял и създаден по-скоро за комфорт на кмета на София, отколкото на жителите на града.

Интерактивната карта ще намерите тук. Използвал съм d3.js и dc/crossfilter, както при повечето ми графики. Този път вместо leaflet използвах директно api-a на mapbox за триизмерна визуализация и векторните им tile-ове предвид количеството информация, което се показва и обработва в реално време. Oтворените данни са готови за сваляне тук в CSV и GeoJSON формат. Последните съдържат пълен списък със сигнали, статусите и геометрията към тях, както и справките, които използвам за картата. Първите се обновяват на всеки час докато справките за картата – всеки петък вечер.

The post Данните на Call.Sofia в разбираем и удобен вид first appeared on Блогът на Юруков.

Умиранията в България 2010-2022 г.

от Боян Юруков
лиценз CC BY-SA

В началото на годината обнових интерактивната графика с умиранията и смъртността от всички причини за последните 12 години. Добавих филтрите за 2022-ра. След запитване от колега добавих и линейна графика в допълнение към кръговата. Филтрите показват същите една до друга.

Графиките от последните две години остават непроменени: 2020 и 2021. Припомням, че тези данни показват само в абсолютни стойности, както и спрямо населението. Сравнението дори в рамките на България и за период от 10 години води до изкривявания заради променящата се възрастова структура. Затова ви съветвам да прегледате текста ми за това как може правилно да сравняваме този показател през годините и между държави. Преди време бях оборил и мита, че в България се умира едва ли не най-много.

Може да отворите графиката на нов екран или да я разгледате тук:

Причината, разбира се, да се обръща внимание на тези данни, е пандемията на коронавирус. Има доста объркване какво показват данните за смъртността, митове за причините за увеличението и разликата между огромното превишение и доказаните случаи на починали от COVID19.

От горните данни смесени с тези публикувани редовно в отворен формат от здравните власти, може да видим интересни разминавания между заболеваемостта и смъртността от последната вълна. Обяснения за това бяха дадени доста, включително заради характерните особености на конкретния щам. Отново скрити в данните са обаче значително по-високата заболеваемост сред децата, последствията от които ще осъзнаваме тепърва.

Със същите данни може да сравним и процентът на доказано починалите от COVID19 спрямо починалите от всички причини, както и превишаването на общата смъртност от март 2020 спрямо средното за за дадената седмица от периода 2010-2019-та. Виждат се паралели и интересни разминавания, които бяха вече обяснени с разминаването в диагностиката при първата за България вълна, както и намалената смъртност най-вече през летните месеци заради по-малкото инфекциозни болести, катастрофи и други инциденти като цяло.

The post Умиранията в България 2010-2022 г. first appeared on Блогът на Юруков.

Възрастово разпределение на родилките в България – 2021

от Боян Юруков
лиценз CC BY-SA

Преди 6 години подтикнат от дискусия в Twitter изкарах статистика с анимирани графики за ключов аспект от демографската криза – все по-късната възраст, в която двойките решават да имат деца. По този показател въобще не сме на челните места в Европа. Всъщност, дори погледнато средно сме сред държавите с най-ниска средна възраст на родилките. Все пак отлагането на децата допринася значително за „разреждането“ на поколенията и намаляването на общата раждаемост.

В тази и предишната ми статия отново се съсредоточваме върху жените, най-вече защото за тях има най-точни данни. Този фокус обаче е в немалка степен погрешен. От една страна, жените в детеродна възраст изнасят на раменете си един изключително тежък процес докато в същото време се очаква да отговорят на всички останали обществени очаквания в икономически и социален смисъл. От друга, почти изцяло се пропуска ролята на мъжа в репродуктивното здраве, както и в процесите, които описвам по-долу.

Първото нещо попада в по-широкия дебат за равноправното участие в грижата за децата, бащинството, дискриминацията на работното място, достъпа до ясли и градини, социалната мрежа и сигурност в началото на кариерата и прочие. Тези теми засягат в огромна степен и решението за отлагане на децата и дават обяснение, защо все по-малко се решават на тази стъпка в началото на 20-те си години. Тук следва да включим и все още битуващата стигма и очакване за определена отговорност на жените и то в определена възраст. Решението е лично на всяка двойка и за такова винаги има разнообразни и лични причини. Следвайки общата статистика може само да наблюдаваме резултатите. В никакъв случай обаче не може да определяме конкретен тип решения или аспект от работната или социалната среда като първопричина. Може да се работи в посока стимули и решение на споменатите проблеми. Никой от тях обаче няма да помогне взет самостоятелно.

Вторият споменат аспект е много малко изследван и това не помага въобще на обсъждания проблем. Когато се говори за репродуктивни проблеми, всички обръщат внимание на жените и особено на късната възраст. Докато рисковете и трудностите несъмнено се повишават значително, почти изцяло се пропуска нашата роля на мъже в този процес. Репродуктивните проблеми при мъжете не са по-малко и имат също толкова негативни последствия. Отделно влошеното общо здраве, масовото пушене, липса на спорт и общо затлъстяване на не малка част от сънародниците ни задълбочава проблема. Битува обаче разбиране, че това няма значение и вината се прехвърля почти изцяло на жените. От там и съответно повечето данни и изследвания са с фокус именно върху последните.

С всичко това наум и ясно осъзнавайки, че ефективно продължавам този проблем, реших да обновя графиките с данните между 2000 и 2020 г. Повече подробности за графиките ще намерите в предишния ми текст. Тук ще гледам да мина през важните точки.

Първата графика показва кривата на възрастовото разпределение през годините. Малко трудно се чете и затова направих следващите графики. Вижда се обаче ясно изместване на кривите вдясно към по-големите възрасти. Вижда се също спиране и обръщане на намалението на родилките под 25 г., за което ще говорим после.

Тук се вижда промяната по възрастови групи спрямо 2000 г. Вижда се, че родилките над 30 години заемат много по-голям дял, нещо, което знаем. Децата родени от майки над 45 г. пък са се увеличили 10 пъти, като основното увеличение е било след 2014-та. Обяснението за последното са делата по онова време срещу фонда за асистирана репродукция относно дискриминативните им практики.

Следващата графика показва броя деца родени по възрастова група на майките. Забелязва се резкия спад на броя деца от жени под 25 г. и изместването към 30 и 35 годишните. За това разбираме и от средната възраст на майките като индикатор публикуван всяка година от НСИ. Тази анимация обаче показва динамиката на този процес.

Около 2010-та година нарастването на средната възраст се е дължало не на намалението на ражданията сред 20-годишните, а на увеличената раждаемост сред 35 годишните поради отлагане на деца в края на 90-те. 10 години по-късно обаче вече се вижда ясно изместване на общия профил на жените, а и двойките, които се решават на деца в посока на стандартното за Западна Европа.

Горната графика обаче показва броя деца в абсолютни стойности. В действителност възрастовият профил на жените в детеродна възраст се е променял значително през разглеждания период от 20 години. Повече за това по-нататък. Докато до тук разглеждахме раждания, следващата графика показва раждаемостта – т.е. брой деца на всеки 1000 жени.

Сега се вижда онова паралелно увеличение до 2010-та година при 35 годишните, за което говорих преди. След 2010-та обаче не се вижда вече изместване на профила на родилките. Т.е. жените през 2010-та под 25 г. са раждали почти толкова, колкото тези през 2020-та. Просто като общ брой са били по-малко. Вижда се дори увеличение при тези между 25 и 30 г.

Оказва се, че основната причина за повишаването на средната възраст на раждане не е до каква степен жените навлизащи в детеродна възраст и по-слабите им половинки са готови на деца, а решенията, които техните родители са взели през 90-те. Защото сегашните 20 до 30 годишни са именно тези родени между 1990 и 2000 г.

На следната графика виждаме в лилаво динамиката на броя жени от всяка възрастова група през годините между 2000 и 2020 г. Освен ниската и отложена раждаемост през 90-те, един голям фактор е емиграцията. Затова този път добавих приблизителна оценка какъв би бил броя им, ако изключим изцяло емиграцията. В оценката взимам населението през 60-те и прилагам същите индекси на раждаемост и смъртност, каквито са регистрирани през следващите 60 години.

Виждаме ясно отдалечаване на двете криви колкото повече време минава. Тази разлика отразява не само хората напуснали страната, но и децата им, които тепърва ще влизат в детеродна възраст. През 2010-та година разликата е била около 342 хиляди жени между 15 и 55 години. През 2020-та вече е 415 хиляди. Това е липса изцяло базирана на емиграцията.

Разбира се, тази оценка е доста груба и в нея прозират няколко дефекта. Основният е, че предполага същата раждаемост и смъртност при условия на „затворени граници“. Най-малкото икономическите и социалните ефекти от подобна мярка биха влошили значително и двата показателя. Отделно, че в актуалните данни се отчитат двойки, които са родили деца и за заминали заедно и такива, които са били в чужбина, но са е върнали и са имали деца преди или след прибирането.

Динамиката на населението не е нещо, което може да се обрисува с толкова прост механизъм като описания. Целта тук обаче е да даде приблизителна представа за ефектът, който намалената раждаемост през 90-те има над раждаемостта сега, както и че дори без емиграцията такова намаление щеше да се наблюдава, макар и с известно закъснение.

Един положителен сигнал, който виждаме в данните от последните години, е лекото увеличение на жените навлизащи в детеродна възраст. Вижда се от увеличението на броя момичета под 20 години. Това, разбира се, е ефектът от повишената раждаемост, която видяхме в началото на графиките горе. В същото време е твърде слаб и все още кратък сигнал, за да може да си правим изводи. Вълната на ефекта от 90-те ще има нужда от 40 години да отмине, през което време ще виждаме намаляваща раждаемост. Т.н. демографски преход тепърва започва.

Има две неща, които могат да го обърнат. За първото ще си говорим друг път. Второто е имиграцията и включва както така бленуваното и обещаваното от всеки следващ провъзгласил се за спасител връщане на някаква част от българите от чужбина, така и миграция от трети страни като южна Азия, съседните балкански страни или такива, с които България е имала добри контакти и обмен на студенти в миналото. С досегашната политика, публично говорене, действия към правата на човека и бездействие по ред други теми, което и от двете е трудно да си представим да се случи в мащаби, които ще променят сигнала нагоре.

The post Възрастово разпределение на родилките в България – 2021 first appeared on Блогът на Юруков.