Tag Archives: Данни

Данните на Call.Sofia в разбираем и удобен вид

от Боян Юруков
лиценз CC BY-SA

Община София има портал за сигнали и жалби, в който всеки жител или гост на града може да съобщи за проблем – call.sofia.bg. Използвам го активно още преди да се преместя от Франкфурт в София и като замисъл го намирам за добра идея. Самият сайт не е особено добър от гледна точка на използваемост, но по-важното е, че практически всички сигнали се разпределят на районните кметове, които често нямат ресурс или дори право да ги решат.

Подбуден от типично българския ни цинизъм, исках да видя, дали сигнали от сайта изчезват. Повод за това беше наблюдението, че на началната страница се виждат само последните 5000. Затова както с документите на Направление архитектура и градоустройство, написах скрипт, който през час да тегли най-новите сигнали. Тъй като исках да видя къде е имало исторически най-много проблеми, изтеглих всичко назад във времето заедно с обновленията и геометриите. Почти всички сигнали имат посочено местоположение като точка, но някои хора си правят труда да отбелязват пътища и цял регион.

Така се оказа, че имам всичките им данни и мога най-малкото да вадя статистика. Като например брой сигнали със статус приключен – 13%. Повечето сигнали – 77% – получават едно или повече уведомления без да са отбелязани като приключени. Историята на статусите пък ми позволи да видя за колко време отнема от подаването до последното обновление по сигнал. 11% отнемат повече от месец. Също така през работните дни се подават два пъти повече сигнали отколкото през почивните, а в петък – с 10% по-малко от предходните четири дни. Най-много сигнали има за пътна инфраструктура – 28%. На второ място с над два пъти по-малко сигнали е паркирането с 12%. Едва тогава следва замърсяването с 10%, сметоизвозването и осветлението с по 9%.

За да осмисля обаче данните географски и да мога да ги прехвърлям в реално време, имах нужда от инструмент. Затова малко по-малко създадох интерактивна карта, която да показва като колони броя на случаите. Колоните са с основа 50 на 50 метра, а всеки случай добавя около 2 метра над височината им. Има филтри, с които да се избират конкретни данни по години или друг период, категории и прочие. Натискайки на дадена колона ще видите списък с всички сигнали на това място с линове към оригиналния сигнал. Списъкът със сигналите на даденото място, както и панелът с филтрите може да се скриват. Вдясно под бутоните за увеличение на картата има бутон за показване отново на филтрите. Бутонът под него е за промяна на прозрачността на триизмерната визуализация върху картата. Полезно е, ако искате да се ориентирате по-добре за улиците под въпросните колони.

След обратна връзка от Linkedin и кмета на Слатина Георги Илиев добавих няколко неща, включително филтър по райони, за да може да се сравни активността и случаите разпределени там. Може също да се превключва показване на абсолютен брой сигнали, както и спрямо населението на региона. Границите и оценката за населението на последните взех от отворените данни на практически закритата вече Софияплан.

Преди обаче да погледнем самите данни, както винаги следва да поговорим за условностите им. Както при Фонда за лечение на деца поет в последствие от НЗОК, тук също показват единствено това, което се поддържа като масив от данни от СО. Има сигнали с автоматично добавен маркер на мястото на Софийска община. Тях съм ги скрил от картата, например. Има и такива добавени с други общини и области. Има сигнали със сбъркана година в датите, както и понякога с десетки пъти изпратен един и същ сигнал за едно и също нещо. Има също много тестови сигнали използвани видимо за проверка на нови категории и функции.

Активността по сигналите идват най-вече от районните кметства, почти винаги под формата на сканирани и прикачени писма. Рядко се случва да добавят изрични коментари – най-вече при отхвърляне на сигнал. Тук е важно да се разбере, че получен отговор или дори „приключен“ сигнал не означава, че даденият проблем е решен. Това може да се декларира дори в приложените документи, но дори тогава няма някаква форма на проверка или потвърждение. Системата не позволява последващи коментари или обновления или дори съгласие с изпратения статус или информация. Връзката е еднопосочна.

По подадените сигнали може да съдим най-вече за активността по теми, райони и конкретни места. Именно тук визуалното представяне на информацията помага най-много. Докато самата карта на call.sofia да показва някаква форма на групиране по клъстъри, то не позволява откриване на „горещи точки“. Всъщност, използват точно същото групиране в картите си преди единадесет години. Основният проблем обаче е, че показват само активните сигнали, т.е. тези, на които не е отговорено, а се очаква разглеждане. Освен, ако един по един не разглеждаме десетките хиляди преди това познавайки поредните им уникални номера, няма да знаем къде е имало голям интерес към даден проблем. Именно това направих.

Единственото, което може да ни покажат тези данни обаче е точно това – активност, интерес и някаква форма на доверие, че нещо може да се случи по дадената тема, та дори това да е само публичност. Повечето сигнали не означават непременно повече проблем, а наболял такъв, активна група граждани на това място или голям трафик от хора. В централната част на града минават най-много хора и очаквано има повече активност.

Това, което не се забелязва е значимо увеличение на активността през годините. След очаквано ниската активност през 2020-та, има едва леко покачване през 2021-ва, също както предходните две. Излизат между 54 и 60 хиляди сигнала на година, което изглежда много докато не сметнем, че става въпрос за 164 сигнала дневно в град с два милиона жители и ужасна инфраструктура.

Видимо липсва, е двустранна комуникация, прозрачност какво се случва и какво се планира, както и оценка на свършеното от подалите сигнала и живеещите в региона. Това неизменно се обвързва с липсата на самостоятелност при голяма част от решенията и бюджетите на районните кметства, както и абсурдното управление на градското планиране във всичките му аспекти.

Независимо, подаването на сигнали има голямо значение, защото постигат публичност на конкретни проблеми. Отваряйки данните на този портал постигаме и донякъде прозрачност на историята на тези проблеми и натрупването им. Картата, която направих, е пример как следва гражданите да използват отворените данни на администрацията, а защо не и частни организации. За разлика от първата ми визуализация за българчетата родени в чужбина или тази на активните българи зад граница, тази за сигналите в София може да се използва за реално изследване на данните.

Разбира се, както с НАГ и доста други ведомства, обсъжданите данни въобще не са изначално отворени, така че се наложи да ги отворим през публичните им API-та. Това не прави инструмента call.sofia по-малко полезен, а просто морално остарял и създаден по-скоро за комфорт на кмета на София, отколкото на жителите на града.

Интерактивната карта ще намерите тук. Използвал съм d3.js и dc/crossfilter, както при повечето ми графики. Този път вместо leaflet използвах директно api-a на mapbox за триизмерна визуализация и векторните им tile-ове предвид количеството информация, което се показва и обработва в реално време. Oтворените данни са готови за сваляне тук в CSV и GeoJSON формат. Последните съдържат пълен списък със сигнали, статусите и геометрията към тях, както и справките, които използвам за картата. Първите се обновяват на всеки час докато справките за картата – всеки петък вечер.

The post Данните на Call.Sofia в разбираем и удобен вид first appeared on Блогът на Юруков.

Умиранията в България 2010-2022 г.

от Боян Юруков
лиценз CC BY-SA

В началото на годината обнових интерактивната графика с умиранията и смъртността от всички причини за последните 12 години. Добавих филтрите за 2022-ра. След запитване от колега добавих и линейна графика в допълнение към кръговата. Филтрите показват същите една до друга.

Графиките от последните две години остават непроменени: 2020 и 2021. Припомням, че тези данни показват само в абсолютни стойности, както и спрямо населението. Сравнението дори в рамките на България и за период от 10 години води до изкривявания заради променящата се възрастова структура. Затова ви съветвам да прегледате текста ми за това как може правилно да сравняваме този показател през годините и между държави. Преди време бях оборил и мита, че в България се умира едва ли не най-много.

Може да отворите графиката на нов екран или да я разгледате тук:

Причината, разбира се, да се обръща внимание на тези данни, е пандемията на коронавирус. Има доста объркване какво показват данните за смъртността, митове за причините за увеличението и разликата между огромното превишение и доказаните случаи на починали от COVID19.

От горните данни смесени с тези публикувани редовно в отворен формат от здравните власти, може да видим интересни разминавания между заболеваемостта и смъртността от последната вълна. Обяснения за това бяха дадени доста, включително заради характерните особености на конкретния щам. Отново скрити в данните са обаче значително по-високата заболеваемост сред децата, последствията от които ще осъзнаваме тепърва.

Със същите данни може да сравним и процентът на доказано починалите от COVID19 спрямо починалите от всички причини, както и превишаването на общата смъртност от март 2020 спрямо средното за за дадената седмица от периода 2010-2019-та. Виждат се паралели и интересни разминавания, които бяха вече обяснени с разминаването в диагностиката при първата за България вълна, както и намалената смъртност най-вече през летните месеци заради по-малкото инфекциозни болести, катастрофи и други инциденти като цяло.

The post Умиранията в България 2010-2022 г. first appeared on Блогът на Юруков.

Възрастово разпределение на родилките в България – 2021

от Боян Юруков
лиценз CC BY-SA

Преди 6 години подтикнат от дискусия в Twitter изкарах статистика с анимирани графики за ключов аспект от демографската криза – все по-късната възраст, в която двойките решават да имат деца. По този показател въобще не сме на челните места в Европа. Всъщност, дори погледнато средно сме сред държавите с най-ниска средна възраст на родилките. Все пак отлагането на децата допринася значително за „разреждането“ на поколенията и намаляването на общата раждаемост.

В тази и предишната ми статия отново се съсредоточваме върху жените, най-вече защото за тях има най-точни данни. Този фокус обаче е в немалка степен погрешен. От една страна, жените в детеродна възраст изнасят на раменете си един изключително тежък процес докато в същото време се очаква да отговорят на всички останали обществени очаквания в икономически и социален смисъл. От друга, почти изцяло се пропуска ролята на мъжа в репродуктивното здраве, както и в процесите, които описвам по-долу.

Първото нещо попада в по-широкия дебат за равноправното участие в грижата за децата, бащинството, дискриминацията на работното място, достъпа до ясли и градини, социалната мрежа и сигурност в началото на кариерата и прочие. Тези теми засягат в огромна степен и решението за отлагане на децата и дават обяснение, защо все по-малко се решават на тази стъпка в началото на 20-те си години. Тук следва да включим и все още битуващата стигма и очакване за определена отговорност на жените и то в определена възраст. Решението е лично на всяка двойка и за такова винаги има разнообразни и лични причини. Следвайки общата статистика може само да наблюдаваме резултатите. В никакъв случай обаче не може да определяме конкретен тип решения или аспект от работната или социалната среда като първопричина. Може да се работи в посока стимули и решение на споменатите проблеми. Никой от тях обаче няма да помогне взет самостоятелно.

Вторият споменат аспект е много малко изследван и това не помага въобще на обсъждания проблем. Когато се говори за репродуктивни проблеми, всички обръщат внимание на жените и особено на късната възраст. Докато рисковете и трудностите несъмнено се повишават значително, почти изцяло се пропуска нашата роля на мъже в този процес. Репродуктивните проблеми при мъжете не са по-малко и имат също толкова негативни последствия. Отделно влошеното общо здраве, масовото пушене, липса на спорт и общо затлъстяване на не малка част от сънародниците ни задълбочава проблема. Битува обаче разбиране, че това няма значение и вината се прехвърля почти изцяло на жените. От там и съответно повечето данни и изследвания са с фокус именно върху последните.

С всичко това наум и ясно осъзнавайки, че ефективно продължавам този проблем, реших да обновя графиките с данните между 2000 и 2020 г. Повече подробности за графиките ще намерите в предишния ми текст. Тук ще гледам да мина през важните точки.

Първата графика показва кривата на възрастовото разпределение през годините. Малко трудно се чете и затова направих следващите графики. Вижда се обаче ясно изместване на кривите вдясно към по-големите възрасти. Вижда се също спиране и обръщане на намалението на родилките под 25 г., за което ще говорим после.

Тук се вижда промяната по възрастови групи спрямо 2000 г. Вижда се, че родилките над 30 години заемат много по-голям дял, нещо, което знаем. Децата родени от майки над 45 г. пък са се увеличили 10 пъти, като основното увеличение е било след 2014-та. Обяснението за последното са делата по онова време срещу фонда за асистирана репродукция относно дискриминативните им практики.

Следващата графика показва броя деца родени по възрастова група на майките. Забелязва се резкия спад на броя деца от жени под 25 г. и изместването към 30 и 35 годишните. За това разбираме и от средната възраст на майките като индикатор публикуван всяка година от НСИ. Тази анимация обаче показва динамиката на този процес.

Около 2010-та година нарастването на средната възраст се е дължало не на намалението на ражданията сред 20-годишните, а на увеличената раждаемост сред 35 годишните поради отлагане на деца в края на 90-те. 10 години по-късно обаче вече се вижда ясно изместване на общия профил на жените, а и двойките, които се решават на деца в посока на стандартното за Западна Европа.

Горната графика обаче показва броя деца в абсолютни стойности. В действителност възрастовият профил на жените в детеродна възраст се е променял значително през разглеждания период от 20 години. Повече за това по-нататък. Докато до тук разглеждахме раждания, следващата графика показва раждаемостта – т.е. брой деца на всеки 1000 жени.

Сега се вижда онова паралелно увеличение до 2010-та година при 35 годишните, за което говорих преди. След 2010-та обаче не се вижда вече изместване на профила на родилките. Т.е. жените през 2010-та под 25 г. са раждали почти толкова, колкото тези през 2020-та. Просто като общ брой са били по-малко. Вижда се дори увеличение при тези между 25 и 30 г.

Оказва се, че основната причина за повишаването на средната възраст на раждане не е до каква степен жените навлизащи в детеродна възраст и по-слабите им половинки са готови на деца, а решенията, които техните родители са взели през 90-те. Защото сегашните 20 до 30 годишни са именно тези родени между 1990 и 2000 г.

На следната графика виждаме в лилаво динамиката на броя жени от всяка възрастова група през годините между 2000 и 2020 г. Освен ниската и отложена раждаемост през 90-те, един голям фактор е емиграцията. Затова този път добавих приблизителна оценка какъв би бил броя им, ако изключим изцяло емиграцията. В оценката взимам населението през 60-те и прилагам същите индекси на раждаемост и смъртност, каквито са регистрирани през следващите 60 години.

Виждаме ясно отдалечаване на двете криви колкото повече време минава. Тази разлика отразява не само хората напуснали страната, но и децата им, които тепърва ще влизат в детеродна възраст. През 2010-та година разликата е била около 342 хиляди жени между 15 и 55 години. През 2020-та вече е 415 хиляди. Това е липса изцяло базирана на емиграцията.

Разбира се, тази оценка е доста груба и в нея прозират няколко дефекта. Основният е, че предполага същата раждаемост и смъртност при условия на „затворени граници“. Най-малкото икономическите и социалните ефекти от подобна мярка биха влошили значително и двата показателя. Отделно, че в актуалните данни се отчитат двойки, които са родили деца и за заминали заедно и такива, които са били в чужбина, но са е върнали и са имали деца преди или след прибирането.

Динамиката на населението не е нещо, което може да се обрисува с толкова прост механизъм като описания. Целта тук обаче е да даде приблизителна представа за ефектът, който намалената раждаемост през 90-те има над раждаемостта сега, както и че дори без емиграцията такова намаление щеше да се наблюдава, макар и с известно закъснение.

Един положителен сигнал, който виждаме в данните от последните години, е лекото увеличение на жените навлизащи в детеродна възраст. Вижда се от увеличението на броя момичета под 20 години. Това, разбира се, е ефектът от повишената раждаемост, която видяхме в началото на графиките горе. В същото време е твърде слаб и все още кратък сигнал, за да може да си правим изводи. Вълната на ефекта от 90-те ще има нужда от 40 години да отмине, през което време ще виждаме намаляваща раждаемост. Т.н. демографски преход тепърва започва.

Има две неща, които могат да го обърнат. За първото ще си говорим друг път. Второто е имиграцията и включва както така бленуваното и обещаваното от всеки следващ провъзгласил се за спасител връщане на някаква част от българите от чужбина, така и миграция от трети страни като южна Азия, съседните балкански страни или такива, с които България е имала добри контакти и обмен на студенти в миналото. С досегашната политика, публично говорене, действия към правата на човека и бездействие по ред други теми, което и от двете е трудно да си представим да се случи в мащаби, които ще променят сигнала нагоре.

The post Възрастово разпределение на родилките в България – 2021 first appeared on Блогът на Юруков.

Данни за българите в Германия за 2020

от Боян Юруков
лиценз CC BY-SA

Продължавам със серията от статии по темата. Може да видите предишните за 2016, 2017, 2018 и 2019. Освен поглед над размера на диаспората ни, в предишни години се фокусирах и върху други параметри като среден доход, образования, размер на домакинството и прочие. От DeStatis – германската статистическа служба – обещаха да обновят тези показатели по националност до края на септември, но предишни години имаха склонност да се забавят доста с този срок. Затова тук ще обърна внимание на нещо, за което писах вече миналата година – разминаването между различните оценки за българите в Германия.

Разбира се, има доста оценки правени на крак. Една от тях се намира в данните на МВнР, които показах, че са или отчасти стари, отчасти измислени. Друга беше на арестувания вече шеф на Агенцията за българите в чужбина, която също оборих. Темата е важна, защото не само може и следва да послужи за по-добро разпределение на консулствата ни в страната и планиране на изборни секции, но и да даде по-добра представа за настроенията и движението на българите из Европа. Това, впрочем, е и нещо, на което НСИ се опитва да получи отговор в рамките на течащото в момента преброяване.

Пет важни числа за броя българи в Германия

Най-често цитираното число за българите в чужбина е 388700 към края на 2020 г. От тях 46.3% са жени. Него ще намерите както в българската страница на DW, така и по различни родни медии. Това е числото, което получаваме от таблица 12521-0002 на DeStatis и се отнася до „емигранти живеещи в Германия по националност“. С други думи данните идват от германската имиграционна служба и включва всички, които имат българско гражданство, но не и немско независимо къде са родени. Липсва информация по каква методология се следи, но от отговор на службата става дума, че не са правени ревизии и корекции от 2004-та насам. Това е първото число, което ще срещнете.

Второто число намираме в таблицата за населението – 12411-0009. Тя се води по подобрение на следенето на населението в България – адресни регистрации, минаващи границата, социални и трудови регистри и прочие източници на информация. Методологията е доста точна предвид, че имаше под 1.5% корекция за 10 годишен период при предишното преброяване – както при НСИ, така и при DeStatis. Според тази таблица, в Германия има 368396 български граждани към края на 2020, 47.2% от тях са жени.

Третото число идва от доклада за демографията и чужденците от 2019 г., към който ме насочиха от DeStatis. Тези данни се изготвят отново от имиграционните. Там се говори за около 312000 души, за които се знае, че или те, или родителите им са родени в България. Тук има и малко по-подробна разбивка по гражданство и възраст. 86.2% са емигрирали сами и почти 9% от тях са взели немско гражданство. 13.8% от българските граждани в Германия са родени там и малко над 50% имат немско гражданство. То се получава, ако родителите вече имат право на такова независимо дали са се възползвали от него или не. Общо 22 хиляди деца са с немско гражданство и поне един родител българин – 8 хиляди са под 5г. и още 10 хиляди са между 5 и 18 г. Децата само с българско гражданство са 21 хиляди – 15 хиляди под 5г. и още 5 хиляди между 5 и 18 г.

Четвъртото число, което публикуваха миналата седмица включва хора живеещи в Германия „с български корени“ – таблица 12211-0202. Те са около 270000, от които 49.3% са жени. Това число включва всички, които са родени в България или за чиито родители има данни, че са родени в България независимо дали живеят в същото домакинство или не. Това число не се влияе от гражданството – дали немско, българско, придобито при раждане или в последствие. В числото се включват всички деца родени в Германия, на които поне един родител е роден в България и емигрирал.

Докато последното число за хората с български произход включва тези получили германско гражданство, при първите две това липсва. По тази тема писах подробно миналата година, но накратко казано – имаме данните за последните 20 години и се вижда, че едва 2.7% от имащите право на гражданство се възползват и взимат такова. Все пак кумулативно за този период има малко над 25 хиляди българи, които са се възползвали. Преди 2007-ма, когато имаше изискване да се отказват от българския си паспорт, има значително по-малко на година, в голяма степен и защото е имало 10 пъти по-малко българи в страната. Все пак 3670 души са ни известни, които са се отказали от гражданство. Няма информация колко след 2007-ма са го възстановили. Има индикации обаче, че хора и след това са се отказвали по този начин без да са длъжни. Преди осем години направих допитване по въпроса.

Сериозна част от тези данни, която получава доста внимание, са децата родени в чужбина. Преброяването на последните е пословично трудно като имаме точни данни само за тези, които родителите са си направили труда да изкарат български акт за раждане. Изкарах данните за тях и ги показах в инфографика, за да разберем по-добре къде се намират. Те биват редовно намесвани в политически интриги и полемика. Наскоро тръгнаха слухове за „специални лични карти“ за тях. Преди това лидер на нео-наци партия настояваше, че се фалшифицирали данните за ражданията само защото не бил чул редовните апокалиптични новини в началото на годината.

Въпрос на дефиниция и методология

Събирайки данните така получаваме големи разминавания за Българите в Германия:

  • 413 хил. без значение от гражданство според имиграционните
  • 393 хил. без значение от гражданство според база данни население
  • 388 хил. само с българско гражданство според имиграционните
  • 368 хил. само с българско гражданство според база данни население
  • 312 хил. с български произход без значение от гражданство според имиграционните
  • 270 хил. с български произход без значение от гражданство според база данни население

Ако взимаме тези числа буквално, излиза, че в Германия живеят между 50 и 140 хиляди души с български паспорт, но не родени в България. Според спорадичните изказвания на министри в медиите – какъвто е любимият контролиран метод за изкарване на данни със съмнително качество – около 153 хиляди души са получили българско гражданство между 1990 и 2018-та и броят им се увеличава с по няколко хиляди всяка година. Определено не са малко хората от Македония, Албания, Молдова и Русия, които са взели български паспорт и директно заминали за западна Европа и най-вече Германия. През консулството във Франкфурт редовно повечето на опашката са македонци. Добре документирани са и схемите за масова продажба на български паспорти на албански трафиканти и руски олигарси от страна на родните „патриотични“ партии, които от години контролират ДАБЧ с благословията на ГЕРБ. Така теоретично е възможно 60 до 90% от тях да са заминали директно към Германия.

Друг фактор са фиктивните регистрации по адрес с цел зачитане на престой заради социални придобивки или гражданство. DeStatis признаха, че е нещо, което въобще не е рядкост и че няма как да го контролират. Измеренията обаче и на този феномен са неизвестни. При липса на реално преброяване с посещение по домовете, каквото имаме в България, не могат да получат точна картина. Все пак, тяхното ще е през май 2022 и през лятото ще получим по-добра картина за диаспортата ни, включително очакваната корекция с поне няколко процента надолу.

Попитах ги тези неща, но не очаквам конкретен отговор. Опитам се и да получа разбивка на български граждани живеещи в Германия по държава на раждане. Междувременно имаме разбивка по общини единствено от имиграционните. Тя показва само тези без немски паспорт. Числата тук са в известен смисъл надути, както описах по-горе, но са единствените позволяващи сравнение през годините по места. Затова макар да не може да разчитаме много на тях, подобно на тези на НЦОЗА ги публикувам отново като интерактивна карта:

Иточник: DeStatis

Допълнение

На 10 септември добавих 3-та точка с доклада за демографията и чужденците от 2019 г. след отговор на DeStatis по зададените горе въпроси. Макар да не внесоха яснота от къде идва по-ниското число от таблица 12211-0202, добавиха още едно, което показва разминаването между оценките на имиграционните и данните им за населението според преброяванията.

The post Данни за българите в Германия за 2020 first appeared on Блогът на Юруков.

Online преброяване 2021

от Боян Юруков
лиценз CC BY-SA

От днес започва преброяването през интернет и ще продължи до 17-ти септември. След това преброители ще обикалят всяко жилище и адрес, за да преброяват лично всички. Ако сте сте преброили електронно, достатъчно е да им дадете кода, който ще получите по мейл. Това освен, че пести време, ще намали и контактът, което е важно в сегашните условия.

Преброяването става на тази страница. Регистрирате се с мейл, ЕГН и лична карта. Мейлът за потвърждаване на регистрацията може да се забави няколко минути, също както и този с кода накрая. Важно е в преброителната карта да въведете адреса, в който действително живеете, а не там, където сте регистрирани. Ако адресът не може да бъде намерен автоматично – например, ако сте въвели на ръка описание – ще излезе карта, на която на ръка ще трябва да поставите отметка къде се намира. Това няма да е толкова лесно за някои, но за съжаление е бил единственото решение в редките случаи, които не адресите не съвпадат с регистърите. Също така да преброите само хората, които наистина живеят там – не близки, които обичайно живеят в чужбина или в друго жилище. Българите живеещи постоянно в чужбина следва да се преброят там. Всички европейски държави, както и доста други по света имат преброяване тази или следващата година. Според чл. 39 до 41 от Закона за преброяването всички данни събрани от тази анкетна карта или по друг начин за целите на преброяването са статистическа тайна, не могат да се използват за друго, няма да бъдат предоставяни на други органи и не могат да се използват като доказателства пред изпълнителната или съдебната власт.

Съветът ми е да проверявате внимателно данните въведени на всяка страница. Има възможност да се връщате и поправяте, но само преди да сте натиснали „Запазване“ на последната страница. За сметка на това доста от информацията се добавя автоматично – например дата на раждане или родствените връзки. Нещо, което може да затрудни някои, е квадратурата на жилището и конкретно на стаите, които се използват за живеене. Това са всички без килер, коридор, офис и прочие. При точката какво се отоплява, може да въведете максимално число обитаемите стаи плюс кухнята, ако е отделна стая. Не забравяйте да си копирате и номера, който ще ви излезе накрая. Би трябвало да го получите по мейл, а може да влезете в портала и да го откриете в профила си – натискате на човечето горе вдясно и после „Профил“.

В рамките на предборяването ще допитване търсещо отговор на това както ни кара да останем или да напуснем България, както и дали, колко и кога искаме деца. То ще се проведе сред 44000 случайно избрани адреса и цели да даде представа какви са настроенията в страната.

Преброяването като цяло е изключително важно за редица аспекти от живота ни. Основа е на неща като планирането на бюджета, изследвания влияещи на инвестиции и изборния процес. Възможно е дори да доведе до преразпределение на мандатите в парламента. Най-вече обаче ни дава представа какво е положението в страната и помага да оборим заблуди. Преди 10 години показах графики за етническия състав на населението на база предишното преброяване. Данните от преброяването са в основата на анализите ми за раждаемостта от последните 50 години, детските надбавки и бедността и смъртността и как я сравняваме през годините. Помогна и при показване на данните за българчетата родени в чужбина.

Редовно има критики за това как се провежда преброяването, как се следи населението и дали въобще числата отговарят на истината. При последното преброяване наистина имаше корекция надолу в населението и тя беше с 1.82%. Това е в рамките на статистическата грешка и близко до корекцията, която се наблюдава в Германия, например, при тяхното преброяване. Описал съм вече проблемите на немците с броенето на диаспората ни. Особена критика имаше също към въпросите за самоопределянето – че всеки можел да пише каквото си иска. Това всъщност е идеята на „самоопределяне“. Не може преброителите да вървят по къщите и да пришиват етнос и определения на хората пред тях.

Заради пандемията, по-широкото навлизане на интернет услугите у нас и информационната кампания на НСИ се очаква този път значително повече хора да се преброят през интернет. Ще значителен успех и показателно за интернет грамотността ни, ако успеем да минем 70%. Преди 10 години над 40% от населението беше преброено така. Доста обаче се съмняват в това. Ако имате възможност, може да помогнете и на близките си да се преброят, за да им спестите време и излишен контакт с преброителите.

Допълнение – 7 септември 10:00

За съжаление, се забелязва, че сайтът им се претоварва сутрин и вечер покрай рекламните кампании течащи по медиите. Имайте търпение, тъй като някои проверки и записи отнемат известно време.

The post Online преброяване 2021 first appeared on Блогът на Юруков.

НЗОК и тежко болни деца – бюрокрация до смърт

от Боян Юруков
лиценз CC BY-SA

Заглавието може да ви се струва жестоко, а според НЗОК – навярно и незаслужено. Сведенията за работата им, които научаваме от родители, сочат именно в тази посока. За съжаление, както говорим вече години наред, прозрачността и отчетността на тази дейност на касата практически липсва. Това важеше и за Фонда за лечение на деца в последните си години преди да бъде закрит и дейностите прехвърлени в НЗОК. Там поне имаше обществен съвет, който наблюдаваше и помагаше да се ускорят нещата. Сега това липсва. Докато съществуването на фонда беше „временно решение“ години наред, НЗОК показа крайна неподготвеност, а в последствие и незаинтересованост да постави нуждите на децата на първо място.

Наистина, касата публикува кратки отчети с дейността си. От тях научаваме някои детайли, като това, че са издали малко повече заповеди през последните 6 месеца, отколкото заявления са били подадени. Това говори, че се справят със силно изостаналия куп от стари заявления чакащи често над месец за решение. Виждаме обаче в справката им, че над 82% от решенията и 71% от парите са за лечение в България. След като функциите на Фонда преминаха в НЗОК се видя ясна тенденция на прехвърляне на все повече лечения, трансплантации и други процедури в български болници – нерядко с плачевна успеваемост, недостатъчна компетентност и дори неясна нужда.

Фонд за лечение на свързани болници

Макар нуждите на отделни пациенти като процедури и цена да варират силно, наблюдавайки общите разходи и справката на самата каса виждаме, че не само са увеличили значително общите разходи за лечение, но и съмнително са ги прехвърлили към български болници за сметка на високоспециализирани такива в чужбина. Българските специалисти не са се подобрили значително в последните две години и половина, а нуждите на тежко болните деца може само да предположим, че са се влошили в условията на пандемията. Единственото разумно обяснение при липса на детайлна информация, каквато имахме до пет години от Фонда, е източване на касата и облагодетелстване на конкретни специалисти за сметка на болните деца. Тук е нужен детайлен анализ на случаите и сравнение с предишни такива с подобни диагнози. Единствено така може да се направи одит как се е променил начина на взимане на решения и дали това е по целесъобразност или става въпрос за конфликт на интереси.

Отделно такъв анализ би позволил да се разбере къде има най-голямо забавяне в чисто административната процедура. Докато НЗОК и предишни министри пламенно общаваха, че ще се справят с решенията по-бързо, виждаме точно обратното. Касата не изпълнява изискването по закон служебно да се снабдява с документи и експертизи. Вместо това остава стандартна практика да карат родители измъчени вече с диагноза и грижа за болните си деца да обикалят специалисти из цялата страна, за да събират подписи и да се молят за документи. Случва се също да стигат до параграф 22 заради нарочно нескопосано написана уредба.

Всичко това обаче става скрито зад 4-те странички отчет и го разбираме най-вече от водени дела за откази за финансиране или въобще незаведени заявления. Едно от малкото неща, които ни позволява да съдим за работата на НЗОК, е регистърът на Фонда. Той все още се използва макар хвърлените обещания и пари за нов такъв. Все така е и изключително трудно да се извади някаква справка от него, въпреки, че информацията в него е изцяло анонимизирана.

Отворете да не отворим ние

Трудно, но не невъзможно. От няколко години анализирам данните за заявленията към НЗОК. Линкове към досегашните ще намерите в статиите ми от ноември и февруари. Ето накратко изводите от последните шест месеца – между февруари и края на юли:

  • Подадени са 859 заявления
  • От тях 681 или едва 79% са завършили. 96.7% са с положителни.
  • Взети са 737 решения. Тоест решили са 56 заявления подадени от преди 6 месеца, а 178 тепърва следва да се решават
  • Заявленията решени от февруари насам са чакали средно 32.8 дни да получат финансиране. 7.4 дни или 22.6% от времето са чакали становище от експерти
  • Приемали са средно по 143.2 заявления на месец или 6-7 на работен ден
  • Искали са средно 450 становища на експерти на месец
  • Връщали са заявления с писмо за липсващи документи средно 53 пъти на месец или повече от една трета от всички подадени заявления
  • Само в три случая е отбелязано, че е търсено болнично заведение от касата, а в един случай касата е търсила служебно епикриза

Сравнението с предходните 6 месеца или същия период на 2020-та или предишни години е безпредметно заради пандемията, която съвсем нормално повлия както на администрацията, така и на тежко болните деца и родителите им. Данните за август липсват, защото отне значително време на доброволци да получат и обработят заявленията до края на юли.

Подробни графики

Както обикновено, публикувам и графиките илюстриращи тези изводи. Започваме с броя подадени заявления по месец и разбивка дали и какво решение са получили в бъдеще. Виждаме, че в последните месеци има увеличение на отказите. Няма особена промяна на броя заявления. Има разместване по месеци заради пандемията. Както стана ясно в предишната ми статия, това показва, че НЗОК е блокирала лечението на значителен брой деца чисто административно.

Гледайки същата справка, но като проценти виждаме по-ясно увеличението на отказите след октомври. Също виждаме, че по-малък дял от по-новите са останали без решение, но доста от старите са без ясен статус в регистъра. Въпреки подобрението в поддържането му след първата ми серия от статии през 2019-та, НЗОК изглежда все още зарязват нещата в един момент – например, когато родителите вдигнат ръце и се обърнат към кампании за дарения.

Тази графика показва колко време са чакали за решение средно заявленията по месеца на подаване. Тук включваме само решените случаи, така че след забавянето на онези подадени през май, наример, средните стойности за май ще скочат. Така научаваме, например, че през юли 2020-та заявленията са чакали почти 50 дни за решение, 10 от които са били само при експери. Това число намалява на месец през януари 2021. Виждаме намаление на времето, в което се чака за експерти, особено след огромните проблеми доказващи неподготвеността на НЗОК през първите 6 месеца. Все още обаче средно се чака около месец за решение, което е необяснимо.

Тук се виждат заявленията по месец на решаване. Забелязва се увеличаване на капацитета в последната година като всеки месец са взимали поне 100 решения. Разбира се, това не дава никакви сведения за „качеството“ на решенията и конфликтът на интереси във всеки от тях.

Тук отново виждаме времето, за което децата чакат за решение, но този път към момента, в който касата е взела такова. Вижда се отново намаляване на експертите, но общото намаляване на цялостното време е минимално. Това сравнено с разбивката по месец на подаване показва, че НЗОК са склонни да решават част от последните молби по-бързо докато други застояват значително време. Също така показва липса на подобрение в работата на касата в последните две и половина години. Важно уточнение тук е, че тези данни често не включват времето прекарано от родителите в събиране на документацията нужна въобще да им приемат заявлението.

Разбивката по дейности не дава подробна информация за времето, което всяка от тях отнемат, за да забавят решението. Виждаме обаче броя извършени такива. Все още има прекалено много писма към родителите за липсващи документи. Почти винаги те могат да бъдат набавени значително по-бързо и евтино по служебен път. Например, почти не се въвеждат в системата, че са искани епикризи служебно. Най-много са становищата от експерти. Сравнение с времето на Фонда виждаме, че има много повече бюрократични процедури като брой при не особено голяма разлика в броя на заявленията.

Тази графика показва броя на залежалите заявления във всеки един момент. С други думи, колко заявления залежават във всеки един ден от годината на някое бюро докато получат решение. Тъй като има доста заявления с неясен край, съм добавил в червено само тези, по които няма решение 30 дни след последното действие по тях като писмо или становище. Виждаме ясно натрупването и бюрократичното забавяне в сравнение с работата на Фонда.

На последно място показвам отново колко време са чакали заявленията към момента на решаването им. Виждаме, че тези решени до седмица след подаването се увеличават леко, но в съответствие с броя подадени. Остава значителния дял на тези, които са чакали между седмица и месец. През последните няколко месеца намаляват леко чакащите над месец, но делът им отново остава поне 1/3 от всички.

Всичко това е само механично сравнение на анонимизирани данни по месеци и дни. Не ни дава качествено сравнение за това как се лекуват тези деца, какви конфликти и търкане в процедурите срещат и защо при значително по-голям бюджет, НЗОК успява да лекува по-малко деца по-зле. Корупцията и конфликтът на интереси тук би било предпочитано обяснение, само защото алтернативата е болезнена некомпетентност.

The post НЗОК и тежко болни деца – бюрокрация до смърт first appeared on Блогът на Юруков.

Едни (не)отворени данни за детските надбавки

от Боян Юруков
лиценз CC BY-SA

През май 2017-та година поискан по ЗДОИ информация за изплатените детски надбавки от социалното министерство. Интересуваше ме за колко семейства и колко деца са изплатени те за всяка община. На тази база направих анализ и карта с различни изводи. Един от тях беше, че броят деца следва почти икономически признак, а далеч не етнически такъв. С последното се спекулира доста, особено що се отнася до използването на този вид помощи. Цялата статия ще намерите тук: Данните за детските надбавки и какво може да научим от тях

Онзи анализ се базираше единствено на данните за 2016-та година. Затова наскоро реших да искам обновените данни включвайки отказите за помощи, както и разбивка не само по общини, но и за всеки месец от януари 2016-та до декември 2020. Включих също така справка за получените в натура помощи от непълнолетни майки. За последните писах подробно през февруари 2016-та използвайки данните на НСИ от тогава.

За справката използвах портала по ЗДОИ и получих доста бързо подробен отговор. Интересното беше, че освен по мейл, както исках, ми изпратиха справките и по пощата на дискове. Това несъответствие с вътрешните правила и въобще как се предоставят данни е нещо, по което ще работим.

За съжаление, както и в други случаи, не ми остава все още време да обработя данните, да ги визуализирам смислено и да направя анализ подобен на този от преди 4 години. Може би нещо се е променило от тогава. Може би има динамика между годините или по месеци, за която не знаем. Може би има условности в данните, които виждаме.

Затова пускам таблицата свободно за всеки, който иска да я използва. Ако направите нещо с тях, ще се радвам да пуснете линк в коментарите. Направих си труда да ги събера в две таблици, тъй като ми ги бяха предоставили в повече. Стигнах само до там да отбележа общините по NUTS4 кодове, за да може да се покажат по-лесно на карта като тези тук.

Забелязват се обаче някои подробности. Има записи с квартали в градове като София, Пловдив и Бургас. Тях съм ги отбелязал с пореден номер след NUTS4 кода. Например VAR0601 до VAR0605 за Варна. При данните за помощи в натура има и запис за София-област, т.е. момиче, за което се знае, че живее в областта, но не е ясно точно къде. Поне така предполагам. За да се покажат тези на карта, трябва или да се съберат на ниво общини, или да се нареже geojson-а на големите градове по квартали. В някои месеци, особено през 2016-та, има данни за общината, но не за кварталите в нея. Вижда се също, че липсват някои числа за част от 2016-та. Та трябва известно чистене трябва преди да се направи нещо.

Както с данните на НЦОЗА моля за внимание към условностите на данните, кой ги е предоставил и какво показват. Лесно се правят сензации и за това не са ни нужни данни, а и може просто да си ги измислим, както предостатъчно хора правят. С тези тук бихме могли да научим нещо.

Не пускам за първи път данни от справки, за които не ми е останало време да обработя и покажа. Тук ще намерите тези за язовирите в България (дек. 2020), жертвите от войните на България (дек. 2019) и глоби и проверки за пушене в заведенията (фев. 2017).

The post Едни (не)отворени данни за детските надбавки first appeared on Блогът на Юруков.

Как да разберем, че ще ни застроят градинката поне няколко дни преди багерите?

от Боян Юруков
лиценз CC BY-SA

Презастрояването на градовете в пословично, но далеч не толкова, колко усилията на местните власти да избегнат по всевъзможни начини публичността на плановете, обсъжданията и документите свързани с тях. Разбира се, има светлини надежда, в които кметове като Георги Илиев сериозно се старят да разпространяват такава информация и да канят съгражданите си. В повечето случаи обаче, дори когато формално изискванията по закон бъдат изпълнени, практически някой ги забелязва закачени до кабинет А на етаж Б в сграда В на общината.

Ситуацията в София е една идея по-добра, тъй като има що-горе добър портал на Направление „Архитектура и градоустройство“. Проблемът обаче е, че твърде често документите за определени апетитни сгради се укриват умишлено от администрацията прикрити зад „технически грешки“, а обществените обсъждания направо се прескачат. Това, разбира се, може да се промени единствено с кадърен кмет начело, който да следи изкъсо администрацията си. Това обаче го няма в София, няма и да го има още няколко години. Кметовете на райони, които имат желание да действат, нямат достатъчно лостове. Решение би била и работеща прокуратура, но и това го нямаме. За последното обаче има какво да направим и то е на изборите на 11-ти юли.

Когато документи и обсъждания се публикуват обаче, ни се дава шанс да участваме, реагираме и протестираме. Често формалната процедура далеч не работи заради вкоренената корупция и сенчестост на Софийска община. Да знаем навреме за нов строеж или промяна на ПУП ни дава лостове да вдигнем шум, а това често дава резултати.

Следенето на портала на НАГ не е приятно занимание. Правя го от месеци всяка седмица и е тягостно. В такива случаи опирам до автоматизация, както направих с ЦИК и заявленията в чужбина. За общата администрация имам обаче друг проект – GovAlertEu, където в серия от Twitter акаунти се пускат новини, събития и документи от всякакви държавни институции. Последно след сушата добавих бюлетина на оценката за състоянието на язовирите, например. Друг пример е, че от години пуска в почти реално време съобщения за земетресения от БАН. През тази система ми минава и автоматизация на Lipsva след като спрях проекта преди 7 години.

Сега добавих и НАГ София към списъка. Освен новини и събития се пускат съобщения за:

  • обществени обсъждания за промени на ПУП и ново строителство
  • визи за проектиране
  • градоустройствени заповеди
  • разрешение за строеж
  • разрешение за поставяне
  • разрешения за строеж на благоустройствени обекти
  • доклади на главния архитект
  • решения РИОСВ за преценяване на необходимостта от екологична оценка
  • заповеди на Общински строителен контрол

съобщения за обществени обсъждания, визи за проектиране, градоустройствени заповеди и разрешителни за строеж. Може да ги следите на акаунта @NAG_SO_public в Twitter.

Проверката се прави на всеки 2-3 часа и както при всички останали наблюдавани сайтове е направена така, че да не натоварва сървърите. Където е възможно в tweet-овете показвам първите страници от дадения документ като снимка. Във всички случаи обаче целта на съобщението е да даде представа за какво става дума и дали би било интерес за следящия новини.

Тук трябва изрично да дам като положителен пример Софияплан, които публикуват доста интересни карти с анализи. Тяхната роля обаче е да напътства градоустройството и да предоставя данни, с които да се взимат решения за бъдещето на града. Както добре виждаме обаче, въпреки добрата им работа, решенията базирани на данни далеч не са в арсенала на сегашната администрация.

Разбира се, далеч по-добре било да има услуга, в която да можеш да очертаеш регион и да получаваш новини за планове специално за него. Това може да е квартала ти, улицата или градинката пред блока. НАГ всъщност има такава услуга, с която да можеш да се регистрираш и да получаваш новини. Опитах се да го направя няколко пъти, но все неуспешно. Това, което съм направил точенето на новини в Twitter не може да замести отговорността на НАГ за прозрачност, но би помогнало да има повече видимост, по-лесно следене на промените и засичане на съмнителни корекции със задна дата, за което немалко имат съмнения.

Отделно един акаунт в Twitter далеч няма да позволи на мнозинството да следят активността в НАГ. Да не говорим, че принципно никое технически решение не може да компенсира дефектите в управлението, администрацията, регулаторната рамка и правосъдието. Също както отворените данни ни позволява да насочим фенера на общественото внимание.

Подобни електронни услуги могат да станат съвсем лесни, ако портали като този на НАГ, а и други информационни системи на администрацията, се създават в съответствие със закона и предоставят автоматични интерфейси за обмен и отворени данни. Така ще дадат възможност не само на актунти като този, но и на всякакви приложения да уведомяват заинтересовани за актове на администрацията. Това не се прави обаче дори когато няма корупционен риск – просто липсва визия в законодателната и изпълнителната власт също толкова, колкото и в местната. Затова кандидатури като тази на Божидат Божанов в 24 МИР София са толкова важни на изборите на 11-ти юли.

Ако имате идеи какви други регистри и новини могат да се добавят, пишете с линк в коментарите. Може би вашият град има подобен портал или страница с обявления.

The post Как да разберем, че ще ни застроят градинката поне няколко дни преди багерите? first appeared on Блогът на Юруков.

Търси си=’в’ ИСУН/> пеша, бе!

от Боян Юруков
лиценз CC BY-SA

Днес Томислав Дончев съвсем без ирония помоли да отбележи, че не трябвало да се чака съгласие за публикуване на най-големите получатели на поръчки и проекти по еврофондовете, а можело просто да се видят в портала на ИСУН.

Да, наистина – там са… почти. Липсват онези прибрали стотици милиони скрити зад Автомагистрали ЕАД и подобните паравани за безконтролно харчене. Но какво са това няколко стотин милиона между приятели?

Да, наистина може да се намерят. Дори като пуснаха портала се похвалиха, че имат отворени данни. Т.е. пак имат отворени данни, защото бяха платили за такива в стария ИСУН, който беше много хубав, ама не беше готов, особено от гледна точка на прозрачността и трябваше да го ремонтират.

Та аз като чух това се засилих към портала за отворени данни на същия този кабинет, в който Дончев така дейно работеше за електронни услуги пръснати тук-таме, че да ги пише за egov и да мирясаме. Да, там имаше данни за бенефициентите – от 2015-та. Малшанс.

Отворих ИСУН и о, чудо! – има бутон за сваляне на отворени данни. Най-накрая! Затърсих къде мога да направя подобни справки и да сваля нужното ми, но уви – нямаше. Трябваше да се сваля всичко програма по програма.

Пуснах първата и зачаках. Свали се файл от 1.7Mb за Транспорт и транспортна инфраструктура. Повторих същото още 20 пъти докато след 20-тина минути не получих 307 Mb в XML файлове.

Ако не знаете какво е XML и как се работи с него, съжалявам, ония курс по Excel в офиса дето проспахте няма да ви помогне. За практически всички журналисти данните в този формат са безполезни. Затова често се обръщат към хора като мен да ги сдъвкват в нещо потребно. Аз с така отворена информация мога да работя. Повечето, които имат нужда от нея веднага – не.

Разбира се, с данните следва да има схема и описание кое какво означава, каква е структурата и номенклатурите, но такова нещо почти не се среща в родната администрация. Затова не следва да се учудваме, че не са си документирали собствените данни. По имената на полета избрани наслуки от навярно разбрал значението им програмист аз догадих какво би трябвало да значат изначално. След това написах няколко скрипта на bash да извадя статистика за структурата, за да знам с какво си имам работа. 41280 проекта, 54451 юридически лица със 122049 взаимодействия между тях. Тръгнах да пиша нещо набързо на bash да извади имената им, взаимовръзките и прочие. Т.е. да сдъвква тия 300Mb от машинно четима информация. Утре ще си играя още.

Междувременно намерих и доста грешки и липсваща информация. Вземете например АНИВА ЕООД с ЕИК 121282600. Няма специална причина да избера тях. Нямам и идея кои са – просто бяха първите в търсачката. Уникалният код в данните им е b1be295ec5e347a7081ff257e61ab5e6f2ea4982. Според търсачката са изпълнители в 5 проекта. В отворените данни обаче се виждат само в двата от Развитие човешки ресурси, но не и в трите от Иновации и конкурентоспособност. Но какво толкова? Тук само за едни 812156.50 лв. говорим – даже за половин чехмедже няма.

Та дори сваляйки суровите данни и с нужните технически умения да се борави с тях, пак няма да получим вярна справка за реално получилите еврофондове. Нищо от това всъщност не е ново – за проблемите с данните от еврофондовете, достъпността и грешките говорим от години. То дори цели проекти изчезваха в портала с обяснение за системни грешки. Една съвсем явна управленска „грешка“ беше дългото криене на данните за селските райони. ПРСР нарочно години наред не беше вкарван в ИСУН, за да може ДПС да се нахрани скрита от погледите на обществеността.

Затова, да драги мои – наистина в ИСУН ги има данните. Повечето поне. И ако искате въпросната справка, а хора като мен не си вдигат телефона, защото изработват данъците за вилите за тъщи на заместници и съветници, за които същия този Томислав Дончев мижеше почти десетилетие по коридорите на МС, то хващайте молив и тетрадка и започвайте да смятате на ръка прелиствайки търсачката на ИСУН.

Така или иначе все още искат всичко на хартия – с мокър печат и „вярно с оригинала“. Та и отворените данни на ИСУН те така.

The post Търси си=’в’ ИСУН/> пеша, бе! first appeared on Блогът на Юруков.