Tag Archives: България

Числото, което ще чуете днес, е грешно

от Боян Юруков
лиценз CC BY-SA

В следващите дни ще срещнете едно число често из медиите – 48754. Толкова раждания е имало в България през 2024-та г. поне според сайта clinica.bg. С това число има много проблеми, но се цитира редовно по това време в последните години заради острата липса на други данни – също толкова грешни или изцяло подправени, но подходящи за генериране на сензация.

Писал съм много по темата в последните 15 години и накрая ще сложа изчерпателен списък с текстовете ми разглеждащи различни аспекти на данните за раждаемостта, както и хронологията на проблемите със съобщаването им. Тук ще се опитам сравнително кратко да обясня защо горното число е грешно, от къде е взето и защо спрях отдавна да следя данните, които въпросния сайт съобщава.

Още на 3-ти януари предупредих в социалките, че това число ще излезе около тази дата. Дадох за пример разминаването миналата година с няколко хиляди деца на тогавашното число изнесено от clinica.bg и данните на НСИ. Проблемът на данните им е първо източникът, второ времето на справката и трето какво всъщност показва и какви твърдения правят с него.

Първо, те твърдят, че се базира на данните на НЗОК за заплатени раждания в страната. Таблицата, която показват, дава разбивка за брой секцио, недоносени, усложнения и прочие. Тази справка не е от НЗОК, а по-специално от регистъра за ражданията. Това е един злополучен регистър, за който ще прочетете много в списъка със статии по-долу, но за сега трябва да знаете, че болниците следва да подават данни за всяко раждане и детайлите по него. Знам, че са взели данните от там, защото през 2018-та получих същата разбивка по болници и публикувах статистика от нея. Колкото и да беше интересна, заради описаните по-долу проблеми спрях да я следя, тъй като е безсмислена.

Макар болниците да имат задължение до три дни да публикуват данни за ражданията, много малко го правят. Някои въвеждат със забавяне от 3 до 6 месеца, някои не въвеждат правилно. Това значи, че данните за някои раждания през 2024-та може да се въведат чак април или май. Това установих след няколко годишно автоматично следене и анализ на публичната част от регистъра. След анализа ми и предупрежденията, че се използва само за фалшиви новини, въпросната публична част беше спряна. Частта за болниците и задължението им обаче остана. Няма индикации да има промяна в липсата на контрол над качеството на данните, което ги прави също толкова ненадеждни, колкото преди десет години. Това важи и за разбивката по усложнения и начин на израждане.

Друго сведение, че не са използвали данните на НЗОК за плащания, а регистъра за ражданията е разминаването им с данните на НЦОЗА. Критика към техните данни имам премного и отново ще я намерите в списъка долу. Те също публикуват данни за раждаемостта и използват плащанията на НЗОК за източник, но гледат не ражданията, а брой родени. Числото се разминава, но с около 2000 на година – толкова са броя на многоплодните раждания. Дори така не може да се обясни разликата в числата им – за 2023-та НЦОЗА съобщава с доклад на 1-ви февруари, че е имало 49795 живородени, а clinica на 14-ти февруари – за 49610 раждания. Разлика от 185 деца. За 2024-та НЦОЗА казва на 4-ти февруари, че са 49556 живородените, а clinica – на 11-ти февруари, че ражданията са 48754. Разлика от 802. Впрочем, според НСИ за 2023-та ражданията са били 57478 или 7868 повече, т.е. грешка от 13.7%.

Тук идваме към втория проблем – кога са взели данните. Твърдят, че източника им е един и същ – НЗОК, но справките им са с около 10 дни разлика. Разминаването не би трябвало да има значение, тъй като 2024-та е привършила отдавна, но видимо има. Реалния източник е различен и през времето изникват доста данни. Анализите ми за предходни години показват, че някои от ражданията няма да бъдат въведени и след няколко месеца. Интересно тук е също как въобще са взели данните от регистъра на ражданията. Както споменах, публичната част е спряна, а справките по болници никога не е била част от нея. През 2018-та получих справката от човек в институцията със служебен достъп. После ми беше отказано по ЗДОИ същата справка. Обсъждания сайт е свързан с бивши служители на министерството, които обаче отдавна не са част от системата. Изниква въпросът дали все още нямат служебен достъп до ресурси, които не би трябвало да имат. Ако пък са искали справката по ЗДОИ, защо я получават, а на други същото се отказва.

Третият проблем е какво твърдят и какво намекват в текста си. Изрично посочват, че числата не включват раждания непокрити от НЗОК и такива в чужбина, навярно в отговор на критиката, че изкарват крайно занижени данни спрямо тези на НСИ. С това обаче намекват, че в официалните данни се включват родените в чужбина българчета. Това категорично не е вярно. Първо, методологията на НСИ показва, че те броят ражданията по подадени от съобщения за раждане, също както всички актове за гражданско състояние. Такива има само за родени в страната. На родените в чужбина се вади ЕГН директно в ГРАО с молба и чуждестранен акт за раждане голяма част от тях се регистрират месеци и години след раждането по различни причини.

По случайност получих справка за родените в чужбина и получили българско ЕГН именно на 11-ти февруари, когато излезе и статията на clinica.bg. Ще пусна отделна статия с подробна информация за последните 35 години, но накратко – за българчетата родени в чужбина, на които родителите им са извадили български паспорт скоро след раждането (т.е. до края на януари 2025-та) са 8029. Тези родени през 2023-та вече са 15031, защото родителите им са имало повече време да се приберат и извадят паспорт. През последните години общия брой се върти около 20 хиляди деца родени зад граница. Нито сметката не излиза, а методологията и отговорите на НСИ оборват намеците на clinica.bg.

Обяснението не се получи кратко, а не съм засегнал доста аспекти от темата. Стигнахте до тук, така че може да ви е интересно да прочетете и за тях. Вярвам, че търпеливо ще изчакате и окончателните данни на НСИ през април, когато отново ще си говорим по темата. Пускам списък със статиите ми до тук, но вместо заглавията им слагам отговор на какъв въпрос отговарят. Не са в някакъв определен ред:

The post Числото, което ще чуете днес, е грешно first appeared on Блогът на Юруков.

Не се отдавайте на нихилизма

от Боян Юруков
лиценз CC BY-SA

В градската среда, ако нещо ви се струва, че не наред, то почти сигурно не е и трябва да му се обърне внимание. Ето два примера.

Има една сграда с доста силно и … артистично осветление. Хора от квартала се оплакваха в групите, че им е направо дискотека в прозорците нощем. Поне един написа, че има дете с фоточувствителна епилепсия и им е проблем редовно. Пуснаха сигнали до общината и се установи, че цялото им външно осветление не е по проект и нямат отделно разрешение. Не го махнаха изцяло, но поне го намалиха и вече над година „дискотеката“ спря.

Една улица до нас наскоро разбрах, че е еднопосочна. Преди не беше, а сега има един леко скрит знак и липсват другите задължителни по кръстовищата. Има също една измислена пешеходна пътека, която привидно не е по изискванията. Далеч нерядко срещано, но ми се стори странно и питах. Оказа се, че един небезизвестен инвеститор без схема за движение решил да начертае улицата, да си бодне знак и да я направи еднопосочна, за да си паркират там от блока.

Та думата ми е да питате и настоявате. Не се отдавайте на нихилизма. Само така нещата се променят и усилията придобиват смисъл.

The post Не се отдавайте на нихилизма first appeared on Блогът на Юруков.

Промяната в данъчното споразумение с Германия, която засяга всички работещи сезонно там

от Боян Юруков
лиценз CC BY-SA

Става въпрос за споразумението за избягване на двойното данъчно облагане с Германия и засяга всички българи, които имат някакви доходи в Германия, но обичайно пребиваване в България. Т.е. през по-голямата част от времето сте в България, но работите, давате имоти под наем, имате акции в Германия или някакъв друг доход. В края на 2023-та имаше промяна в това споразумение, която засяга най-вече гастарбайтерите, особено онези, които получават под необлагаемия годишен лимит в Германия. Промяната важи за 2024-та, т.е. трябва да се подаде данъчна декларация до края на април 2025-та.


Първо, трябва да посоча, че не съм данъчен консултант, описаното долу е само предупреждение за ситуация, която засяга много, не е съвет как да се попълват данъци или кое засяга кого. Следа да потърсите информация за спогодбата, да се свържете с НАП, ако имате въпроси или да се консултирате сами с данъчен консултант, който да изясни ситуацията Ви. Запознат съм с темата единствено в личен капацитет, когато се връщах от Германия и мога да дам начални напътствия къде да търсите за ограничен кръг от казуси.


Като се вземе това под внимание, казусът, който двете страни са се опитали да решат с тази промяна е, че голям кръг от хора работят в Германия за кратко време, печелят под лимита от колко 11 хиляди евро и за данъчно задължени в България. Заради този необлагаем лимит не дължат никакви или почти никакви данъци в Германия. По смисъла на споразумението обаче, тъй като стопанската дейност се извършва в Германия за немска Германия и прочие, данък не се дължи в България. Целта е да не се обременяват физически и юридически лица с двоен данък. В конкретния казус обаче ефективно за тези доходи не са плащани данъци никъде. Доколкото надали някой би обърнал внимание на няколко случая, масовостта на практиката води до въпросните промени.

Една от промените накратко е промяна на метода за избягване на двойно данъчно облагане от от „освобождаване с прогресия“ към „обикновен данъчен кредит“. Това означава, че доходът в Германия ще се добавя към данъчната основа в българската данъчна декларация и ще се плащат стандартни данъци върху тях като се приспада сумата на всички данъци платени в Германия. По-просто казано – ще се дължат социални и 10% ДОД за спечеленото от гастарбайтерите минус ако са платили някакви данъци в Германия.

Това става в приложение 9 част II от данъчната декларация. До сега се попълваше част I. Добавят се доходът обърнат в лв., данъци и други удръжки, които са взети в Германия. Ако използвате електронното подаване, както би следвало да правите, останалото се изчислява автоматично. Ако имате някакви удръжки в Германия като данъци и социални, следва да искате от работодателя си бележка за това, да я преведете на български от заклет преводач и да я прикачите. Тук виждате снимка на полетата:

Срокът за подаване на декларациите в България с доходи от 2024-та е 30-ти април 2025. Ако е подадена в този срок, може да бъде коригирана (например да добавите пропуснат доход или документ) еднократно до 30-ти септември. Също, при подаването ако липсва документ или има неяснота се свързват с вас за изчистване на проблема и имате срок от две седмици до месец да го направите. Ако очаквате нещо такова, най-добре да се свържете първи с тях.

Доколкото изчетох промените, това засяга също доходите от дивиденти, наеми и други плащания. Там обаче не би следвало да има разлика в крайната сметка, тъй като вече се плаща данък в Германия и то по-голям от този в България. Т.е. пак трябва да се декларират, но различно. Очаквам отговор от НАП по този въпрос. По тази точка ще напиша скоро статия как да си възстановите пари от немските данъчни, ако имате дивиденти там и сте платили около 27% капиталов данък. Според споразумението трябва да е 15% и има механизъм, но не е особено приятен. Както и с българската Европейска здравна карта и гръцката карта за тол такси е изцяло електронен метода и искам да довърша процеса сам преди да го опиша.

Текстът на промените на споразумението с Германия ще намерите тук, новината с описанието от НАП е тук. Не намерих коригиран текст на споразумението, но старото е тук. Когато го намеря ще го свържа тук. Описание как се подава данъчна декларация по електронен път е описано от НАП тук. Трябва ви ПИК, който се взима физически от техен офис или електронен подпис, ако имате такъв. За преводачи може да използвате който и да е. Има вече изцяло online такива, които изпращат сканиран в PDF документ и като опция – физически по куриер. Аз просто взимах PDF-а и го закачах към данъчната декларация. Използвал съм тези тук и бях предимно доволен.

Отново трябва да повторя, че всичко описано тук не е данъчен съвет или инструкция за попълване на декларацията. Засегнал съм един често срещан казус за физически лица. Ако сте декларирани на свободна професия там или имате собствена фирма, тогава детайлите се променят сериозно. Доста работодатели, особено в строителния сектор, хигиената и гледането на болни хора правят машинации, особено когато съгражданите ни не си знаят правата, регистрирайки ги като консултанти или подизпълнители с фирми. Имаше и голям скандал преди време с точене на социални, в които хиляди наши строителни работници бяха наказани като ефективно жертви на схемата.

Затова е много важно да разбираме добре ситуацията си и да се консултираме със специалисти навреме. Консулствата ни в Германия предлагат помощ и отговори в такива случаи. НАП има гореща линия, където може да търсите отговор на описаните горе казуси. Има също доста данъчни консултанти специализирани именно в тази тема. По мои впечатления, ако целта ви е да сте изрядни, НАП съдейства и отговаря бързо и изчерпателно. Навярно, защото много се опитват да шмекеруват по често крайно очевидни начини.

В тази връзка, докато и преди гастарбайтерите да имаха задължение да попълват данъчна декларация в България декларирайки дохода си в Германия дори да нямаха какви данъци да плащат, НАП не ги санкционираше, за да им спести излишна работа. Това не означава, че не са знаели за доходите – често има обмен да данни, както разбрахме от ония теч преди години. Така доста хора можа да получат честитки за недекларарирани доходи. Стига, разбира се, да няма политическа спирачка от някое популистко правителство, но дори това само ще забави нещата, тъй като давността е дълга.

The post Промяната в данъчното споразумение с Германия, която засяга всички работещи сезонно там first appeared on Блогът на Юруков.

Отворените данни на кадастъра – кой ги отвори, проблемите с тях и защо все пак ми харесват

от Боян Юруков
лиценз CC BY-SA

Преди седмица писах за това как новата система на кадастъра предоставя отворени данни. Те включват както географска информация за парцели, сгради и самостоятелни имоти, така и записи за собствеността на последните от публични и частни юридически и физически лица. За тези няколко дни данните предизвикаха сериозен интерес. Забелязаха се доста добри въпроси, критика, но и откровено подвеждаща информация – къде от притеснение, къде от зла умисъл. Затова искам да разясня няколко неща, включително какво не знаем и какво очакваме да видим.

Защо ги има тези данни?

Първите, които ги вкараха в употреба отвъд GIS системите изглежда бяха BIRD.bg. Аналогично на справките от търговския регистър, те добавиха и тези към търсачката си, която свързва данни за смяна на ръководство, обществени поръчки, еврофондове, споменавания в различни изтекли данни, а сега и собственост на имоти из страната.

Тъй като сайтът на кадастъра все още не предоставя лесна възможност за сваляне да отворените данни, аз го направих автоматично и предоставих архива на BIRD и други. Ще го намерите в края на тази статия, както и скрипта за сваляне. Това, както и факта, че явно първи писах за тях, накара някои да коментират, че аз съм отворил данните. В действителност, за да бъдат тези публично достъпни за свободна употреба данни част от новата система на кадастъра, имат заслуга много хора както в институциите, така и извън нея. На първо място за изискването в закона въобще да има отворен код и отворени данни в такива системи има голяма заслуга Божидар Божанов. Въпреки това виждаме как много често това изискване се пропуска, така че трябва да се даде заслуженото на множество хора, включително политически назначения и отделни хора сред изпълнителите на поръчката, които са направили така, че да се случи. Иначе информацията за тези данни вече беше известна и се е обсъждала в професионалните групи и форуми още през декември.

Доста често да отварям данни, които следва да са достъпни, но не са. Последно така направих с разрешителните за сеч, от години го правя за документите за застрояването и авариите в инфраструктурата. Аналогично от още по-отдавна отварях данните на Столична община за замърсяването на въздуха, когато ресорната агенция отказваше твърдо да публикува навременни данни с разбивка по часове. Когато започнаха да го правят по задължение отвън спрях този поток. В този случай обаче просто разпространих новината, че кадастъра са ги пуснали и може да се използват свободно.

Критика и проблеми

Имаше, разбира се, критика както към новата система, така и към данните. Кадастърът отдавна има проблеми с натоварването, но в случая има оплаквания от функционалността за няколкото хиляди специалисти въвеждащи информация. Доколкото те имат смисъл, осъзнаването защо са важни и какви ще са последствията от тях изисква вникване в материята. Тази седмица е имало среща на министерството, изпълнителите и целевата група на тези системи за оправяне на проблемите и разбирам, че се работи по тях. Има също критика по заданието, следенето на изпълнението и отново срещу определени практики на Информационно обслужване.

Самите данни също имат проблеми и те са в две групи. Първата е за самата справка. Първоначално липсваха данни за няколко общини и селища като Варна, например. На 6-ти добавиха Варна, но пак изглежда, че липсват някои селища. Причината навярно е непълнотата на самия кадастър за цялата територия. В предишната си статия писах, че идентификаторите за физически лица са кодирани, за да не се разкрива лична информация. Първоначалната информация е, че макар кодирани, те са еднакви между различните файлове и така може да се проследи общата собственост на лице без да се разкрива. След статията ми обаче бяха открити редица несъответствия, което може да говори за проблем с алгоритъма. Аналогичен се прилага без проблем при Търговския регистър. Трябва кодирането на ЕГН-тата тук да следва същите правила и настройки както в ТР, за да може информацията да се съпоставя между двете. Не на последно място, свалянето на данните е почти невъзможно на ръка в пълния си мащаб предвид хилядите архиви. Аз написах скрипт за целта, поради което бях сред първите споделили го.

Втората група проблеми са свързани не с новата система, а с качеството на въведената информация, практиките на специалистите работещи с кадастъра, нормативните изисквания към него и исторически причини. Дали даден имот е въведен с очертания, собственост, правилен адрес и прочие информация зависи в голяма степен от това дали е имало нужда за самия собственик. Пример може да бъдат ипотека и продажба. Качеството на тези данни, както и такива в миналото е доста спорно поради редица проблеми от двете страни на масата. Забелязват се грешни адреси, дублирани идентификатори на индивидуални обекти, сгрешени ЕИК на фирми и прочие. Важното тук е, че данните не съответстват непременно с това, което виждаме в имотния регистър, а следва да бъдат само отправна точка за по-нататъшни разследвания.

Имаше, разбира се, оплаквания произтичащи от искрено неразбиране или нарочен опит за внасяне на смут. На няколко пъти се видяха твърдения, че така изтичали лични данни, че толкова голям архив щял да се използва за имотни измами, кражби и изнудване. Риск за измами винаги има, но тези данни по-скоро биха го намалили, отколкото да го увеличат. Данните са достъпни в дори по-голяма пълнота срещу заплащане в имотния регистър. Отворените данни не съдържат лична информация, а тази на компании и общински фирми не е лична или търговска тайна в случая. Аналогични възгласи имаше когато бешемотворен търговския регистър и се видя, че са кухи. Най-любопитна ми беше нишката, която плетат няколко души пишещи по групите и най-вече замесени в имотния бизнес, че тази прозрачност била комунизъм, защото само комунистите ги интересува кой къде какво има, придобива от общински и държавни имоти, национални и градски паркове и сменя като предназначение. Тук не знам какво да отговоря освен, че видимо изкарването на все повече неща на светло притеснява доста хора. Най-сигурен признак за това би бил, ако някой се опита да премахне или ограничи отворените данни на кадастъра с каквото и да е извинение.

Полезни по множество начини

Няма масив от данни, който да е идеален и абсолютно верен към датата на публикуване. Особено в такива мащаби. Ключът към използването правилно на данните винаги е бил да се разбере методологията на събирането им, ограниченията и условностите. Затова винаги прекарвам толкова време в описване именно на тези три неща. Пример са данните за раждаемостта и абортите. Когато писах, че данните от кадастъра са невероятни, имах точно това предвид – въпреки всички описани проблеми и нуждата от чистене на определени очевидни грешки, това е много добър източник, който ще помогне не само за анализи и разследвания сам по себе си, но и е важен базов масив, който да се използва за визуализации на други данни.

В не по-малка степен ще помогне на откриването на проблемите в старите данни, за които говоря по-горе, с въвеждането и практиките на специалистите. Прозрачността в тази си форма изкарва често на преден план дълбоки проблеми в една или друга институция и бранш. Това е причината много министерства и агенции да се опитват всякак да избягват заложеното в закона изискване за отворен код и данни. Отчасти заради лобизъм и активно прикриване на нередности, но в чувствително по-голяма степен страх от видимост на пороците и неефективността. Изисква се смелост и откритост сам да публикуваш подобна информация. Това е най-добрият начин да имаме разбиране и разговор по тези теми и път към поправянето на дефектите.

Може да свалите всички отворени данни на кадастъра към 10-ти януари 2024-та от този архив. Там ще намерите json-ите с линкове и дати на всеки отделен архив с документи, zip с всички свалени документи, един с обърнати всички данни за собственост в csv файл от 24 млн. записа и един с всички shp файлове обърнати в geojson формат и намалена точност на координатите до половин метър, който е по-лесен за използване във визуализации. Ако искате сами да свалите документите, може да използвате полу-автоматичния ми скрипт на bash. Надявам се, че от кадастъра ще направят това по-лесно, например като общ архив от 5Gb.

The post Отворените данни на кадастъра – кой ги отвори, проблемите с тях и защо все пак ми харесват first appeared on Блогът на Юруков.

Кадастъра пусна отворени данни за всичко в България и са невероятни

от Боян Юруков
лиценз CC BY-SA

В края на миналата година писах накратко в социалките, че новият портал на кадастъра е публичен и на пръв поглед има доста полезна употреба – да се следи за незаконно дострояване. В действителност, с тази нова версия се случи нещо, за което натискахме и чакахме от много години – отворени данни за имотите в България.

Информацията, която търсихме са точните очертания на области, общини, землища и отделни парцели. Тази информация има много приложения отвъд работата с недвижими имоти. Преди 11 години, например, бях свалил парче по парче голяма част от тези данни и бях ги обобщил в опростена версия на картата на общините и селищата в България. Пуснах ги свободно с цел визуализации на данни и сам ги използвах в графиките си за данните за сеч, избори и редица други. Аналогично, за картата ми с документите за градоустройството в София през последните четири години съм свалил близо 25% от всички парцели в столицата. Подобно е положението и с 3D картата за застрояването. Данните влизаха в употреба в поне 10 от проектите и визуализациите ми до сега.

с. Априлци в Пазарджик

Затова с радост открих, че в новият портал на кадастъра има секция отворени данни, където може да се свали архивирана цялата спомената информация – отделни парцели, сгради и самостоятелни обекти в SHP формат. Вече свалих данните за община София и няма да се налага да товаря сървърите на НАГ и кадастъра всеки път като излезе нов документ. Данните съдържат много метаданни като площ, брой етажи, точен адрес, собственост, район, начин на употреба и документ определят последното. Дори само информацията за адресите е безценна, тъй като до сега нямаше такава публична база данни в България. Има дори адресите на самостоятелни обекти – гаражи, апартаменти и други части от сгради, включително къде се намират точно и колко е (законната) им площ.

Метаданни за случайна сграда в София

Това обаче далеч не е всичко. Публикувана е информация за собствеността на тези имоти – дали цялостно или частично, физическо, юридическо лице, община или държава и с какви документи и кога е установена тази собственост. Има дори ЕИК и имена на фирмите, а когато е частно лице, името е маскирано, а ЕГН-то е криптирано, така че да не се разбере, но да е пак уникално и да може да се съпостави с други записи. Това е безценна база данни с публична вече информация, която без да преувеличавам ще отвори нова страница в разследванията на злоупотреби на части и публични лица.

Пример за собствеността на парцели в с. Априлци, Пазарджик

Данните в този си вид са генерирани на 14-ти декември. Надявам се да имат възможност да ги обновяват редовно, особено собствеността. Все още липсва известна информация – за 6 общини липсват данни, включително община Варна. От тях, както и сред други общини липсва информация за около 380 селища или 7.2%. Изпратих и друга обратна връзка към създателите на портала и разбирам, че се работи по попълването на цялата информация. Две основни точки бяха двуезична документация и номенклатури, както и начин да се сваля всичко наведнъж.

Дори към този момент обаче е нещо внушително. Бих го сравнил само с публикуването на отворени данни от търговския регистър с тази разлика, че са много по-ясни, подредени и готови за употреба. Показах данните на няколко познати експерти работещи с GIS системи и събиращи информация от подобни регистри от цял свят. Един особено ми пише през няколко месеца да пита дали поне очертанията на парцелите в градовете имаме. Всички бяха удивени от качеството и пълнотата на информацията и метаданните, включително в сравнение с аналогични източници в Германия, Великобритания и щатите.

Центъра на София в сгради и парцели

Успях да сваля всички данни автоматично и вече ги преглеждам подробно. Особено тази за собствеността. Все още нямам идея какво от тези данни и как ще го покажа, но определено има доста какво да се направи с нея. Знам обаче, че ще използвам парцелите във визуализацията си за данните за сечта, които отворих наскоро. Особено за стартиращи бизнеси това ще е много полезно отвъд чистите GIS системи, недвижими имоти и планиране. Ако имате идеи как бихте използвали данните или вече сте направили нещо с тях, споделете го в коментарите.

The post Кадастъра пусна отворени данни за всичко в България и са невероятни first appeared on Блогът на Юруков.

Отворени данни на разрешителните за сеч 2011-2024

от Боян Юруков
лиценз CC BY-SA

Преди почти 10 години си зададох въпрос – къде в България се сече законно и в какви количества. Агенцията по горите нямаше отворени данни за това. Имат обаче регистър на позволителните за сеч, който макар не в достъпен формат, поне е достатъчно структуриран, за да се изведе нещо. На база тези числа тогава успях да покажа данните за сеч с точност до землище на населено място, а след това направих анализ и предложения.

Десет години по-късно малко се е променило. Някои от регионалните дирекции по горите и самата агенция са в портала за отворени данни на правителството. Има дори ресурс с позволителните за сеч, макар покриващ само част от данните и само за четири години. Регистърът си е същия, със същите грешки и 1.57 млн. документа – позволителни за сеч и протоколи след това.

Причината да знам това число е, че в последните седмици свалих цялата информация от средата на 2011-та, когато е започнал регистъра, до декември 2024-та. Там информацията е във вид на обикновена HTML страница подходяща за печат и подпис на хартия, но открих структура в нея. Така обърнах всеки документ в json формат с точната категория и вид дървета, позволена и реална сеч. Включва също констатации за нарушения, актове, кой е глобен и прочие. Разбира се, тук говорим само за законната сеч и документите свързани с нея. Ако не е в този списък, значи не е законно.

Тъй като изглежда самият им формуляр за генериране на тези документи не се използва съвсем коректно, някои от номерата и датите на заповедите не са попълнени. Също кадастриалните идентификатори посочващи точните парцели не са в правилен формат. Това ще се опитам да го оправят в друг момент. Има и други грешки, които съм се опитал да компенсирам в изходните данни.

Освен документите, съм публикувал и списък с обобщена информация за всяка сеч от търсачката им. Там може да се видят дати и количества на сеч и позволява да се свържат позволителните и протоколите, където това не е отбелязано в самия протокол.

Публикувам всички данни в отворен формат свободно, без лиценз и ограничения за използване. Ще се радвам, все пак, ако направите нещо с тях, да ми пишете, защото ми е интересно как са влезли в употреба. Ще създам интерактивен инструмент за филтриране и изследването им в скоро време, но искам първо да пусна данните, ако някой има идея за такъв или друга употреба.

Може да свалите данните от тази папка. Там ще намерите описание на полетата, файл с номерата на землищата и техните имена и ЕКАТТЕ номера, обобщенията списък, който споменах (95М, 18М zip) и архив с документите (6.2G, 1.1G zip)

The post Отворени данни на разрешителните за сеч 2011-2024 first appeared on Блогът на Юруков.

Акаунтите на GovAlertEu са вече основно в Mastodon и Bluesky

от Боян Юруков
лиценз CC BY-SA

Светлината е най-добрият дезинфектант.

Преди малко повече от десет години се замислих, че ми е трудно да следя какво се случва из родните институции и мога да подобря процеса. Затова създадох система, която да изчита по няколко пъти на ден новини, документи, събития и други и да ги публикува в акаунт в Twitter. С времето източниците на информация се увеличиха на 140 от над 31 различни институции, а акаунтите станаха осем.

Проектът се нарича GovAlertEu и до скоро публикуваше съобщения в неофициални акаунти на няколко институции, включително тези на МВР и Министерски съвет. Акаунтът на МВР стана официален на два пъти – за последно при един от редовните кабинети. След това си върнах контрола над него. Този на Министерски съвет все още е официален и имат достъп до него като автоматизацията за публикуване на новини си остава.

Няколко неща се промениха в последната година. Първо, значително увеличеното количество информация, която публикувам за градоустройството в София, Пловдив и Благоевград, както и интереса към данните и визуализациите създаде натоварване на ресурсите, които използвам. Второ, промени в моделът на работа на Twitter/X като мрежа направи почти невъзможна работата на автоматизирани акаунти като моя без да се плаща значителни суми на месец. Суми, които биха били оправдани единствено за големи компании и astroturf бот мрежи, каквито сякаш са единствените останали там.

Още при първите крачки към затваряне на API достъпа до Twitter започнах да гледам мрежи като Mastodon. Тези дни довърших интеграцията и вече е достъпна за използване. Благодаря на @mapto, че ме насочи към подходящ код, който да използвам.

Акаунтите достъпни на новия портал

На адреса m.govalert.eu ще откриете всички акаунти свързани с тази мрежа. Там се публикуват в реално време без ограничения всички новини идващи от институциите. Тази страница е паралелно и портал за ActivityPub протокола, което значи, че може да ги следвате в която и да е Fedi мрежа искате, включително Mastodon. Свързал съм акаунтите пред Fedi Bridge с Bluesky, където съобщенията ще се появяват със забавяне от една до 15 мин.

Линковете към отделните мрежи, включително все още Twitter, ще намерите на самата страница като бутони. В Twitter от началото на годината заради ограниченията ще публикувам единствено препратки към Mastodon с ежедневна статистика колко съобщения са пропуснали следящите там. Като начало това ще се случи за основния акаунт на GovAlertEu, този на МВР и този за градоустройството в София. Този на правителството няма толкова много новини, така че ще остане последен.

Ще забележите, че липсват стари съобщения. В следващата седмица ще генерирам новините поне 4-5 години назад във времето. Искам да развия тази страница като основна за услугата заедно със статистика, индикация кои страници на администрацията са изтрити, изчезнали или променени, както и архивиране на някои от тях. В такива случаи линковете от социалните мрежи ще сочат към архивираната версия.

Също, вижда се, че акаунтът на парламента няма съобщения от известно време. Всъщност, източниците на информация не са 140, а 218 от 47 институции, но една немалка част от тях или са променили сайтовете си значително, или не публикуват вече нужната информация. Предвид смяна на фокуса към градоустройството не съм поддържал тези източници, но с този нов портал ще го направя – един по един ще ги обновя започвайки от страницата на парламента. Тази промяна отваря възможността да разширя значително информацията, която искам да публикувам като до сега въвеждах ограничения заради комуникацията с Twitter.

Моите акаунти в Mastodon и Bluesky ще намерите в линковете под блога ми. Приветствам всякаква обратна връзка и идеи.

The post Акаунтите на GovAlertEu са вече основно в Mastodon и Bluesky first appeared on Блогът на Юруков.

Ученически предизборен туризъм

от Боян Юруков
лиценз CC BY-SA

„Предизборен туризъм“. За сега на учениците само тъй като училищата трябвало да се подготвят за вота в неделя и на практика няма да учат днес и в понеделник. Та са се юрнали всички по екскурзии. Тук изникват няколко въпроса:

Защо отнема толкова много време и усилия подготовката на изборите и броенето след това? Отговорът е лесен – хартиеният вот от край време носи със себе си забавяне, грешки и възможност за злоупотреба. Когато стана ясно, че с машините за гласуване последното е невъзможно, ясно доказуемо и проследимо, направи се всичко, за да бъде спряно. Кампанията за това продължава и сега и на този вот машините ще са просто принтери и ще се брои отново на ръка. Показват все пак колко грешки има в този метод на броене, а затворените училища и спящи комисии по пейки – колко неефективно е всичко.

Второто е защо автобусите са точно на това място и редовно при подобни екскурзии блокират кръстовището? Същото кръстовище ще стане многократно по-натоварено и без автобусите, защото четири огромни сгради се планират около него в близките години. Едната вече е на груб строеж, но е замразена от поне 6 месеца, тъй като строителите са си прибрали лъвския пай от плащането „на зелено“. Друга по-малка сякаш има шанс да я завършат, но вече им се наводняват гаражите от р. Новачица. Третата е предвидена, а четвъртата чака инвеститорски интерес.

За автобусите конкретно обаче трябваше да има алтернатива. Още преди години се говореше колко се блокира другия край на кв. Дианабад от всички автобуси на спортни федерации от България и чужбина при състезания или тренировки в комплекс Диана. Доколкото комплексът ефективно се разпродаваше на части от „частното“ ЕОД собственост на спортното министерство се знае и това би намалило спорта в комплекса и автобусите. Имаше обаче планиран паркинг именно за тази цел – за да слизат безопасно спортистите, които често са деца. Мястото за паркинга обаче един министър на спорт на ГЕРБ тръгна да прави автомивка. Попитан защо, Кралев отговори, че искал да си мие колата и си е негово. Тогава и районният кмет дори идва да ходатайства да не правим проблем и да не го огласяваме, а после и разни от ГЕРБ. В действителност, нито спортното министерство, нито НСБ имат право да оперират автомивка. Готвеха договор със Сталийски да оперира и пере с автомивката срещу жълти стотинки, както му бяха дали басейна и построили ресторант в същия комплекс. Разбира се – за да си мият колите аверчетата на Борисов докато ритат футбол там или прекрояват схемите с КОЙто трябва на вечеря срещу фалшивата камина.

Автомивката я спряхме. Няма и паркинг за спортистите и автобусите им, защото не пасва в ничия схема – само помага на спорта и хората. Би помогнало и на учениците зад автобусите на снимката долу да не притичват между сънените погледи стрелкащи ги от колите сутрин.

Та в една снимка може да видим много неща, когато знаем къде да търсим и има прозрачност. В същото време едни се карат на журналисти, че търсят и питат и правят списъци с такива.

The post Ученически предизборен туризъм first appeared on Блогът на Юруков.

Избори октомври 2024 – нова карта на секциите от Външно

от Боян Юруков
лиценз CC BY-SA

Това е нещо, което определено трябва да се отбележи, защото е някаква стъпка напред. Снощи Министерство на външните работи е публикувала карта на секциите в чужбина. Намерих я случайно, защото по няколко пъти на ден преглеждам мястото, където публикуват таблица с адресите на секциите. Когато има промяна я отразявам директно на моята карта. Същият процес следвам последните няколко вота, докато преди това се налагаше да преглеждам индивидуалните сканирани на PDF заповеди на всяко консулство и да сверявам с доброволци на място.

Вчера сутринта са започнали картата съдейки по метаданните. Публикувана е след 18:00 снощи, тъй като тогава последно проверих сайта им. Съдържа практически същите данни като моята. Тъй като са първоизточника и за пръв път публикуват не само адреси, но и географски координати, ще сравня отново данните с моите. Ще е добро упражнение да проверя с колко метра е отклонението на моята карта. Ще пусна резултатите в близките дни.

Вярно е, че публикуват картата около два дни и половина преди началото на изборния ден и закъсняха малко с адресите този път, но все пак е стъпка напред, за която трябва да ги поздравим. Дава ни надежда, че ще стане практика от доста по-рано за следващия вот. Преди години на поне един вот използваха версия на моята карта като официална след като изрично ме питаха за това. Предоставих я с удоволствие.

Винаги съм казвал, че целта на всяка инициатива следва да бъде да стане излишна. Същото целях с Lipsva, с отворените данни и GovAlert. Картата за изборите в чужбина се налага вече 12 години да я поддържам дори да не живея вече зад граница. Може би този експеримент на Външно да е знак, че това, което правя ще се разпознае като полезно и официален процес на администрацията. От друга страна, постоянството и приемствеността не са силните черти на по-голямата част от публичната сфера, както видяхме с нещо просто като акаунтите @GovBulgaria и @MIBulgaria, които се използваха като официални от Министерски съвет и МВР известно време. Та ще трябва да мине време и няколко вота, за да видим.

The post Избори октомври 2024 – нова карта на секциите от Външно first appeared on Блогът на Юруков.

Избори октомври 2024 – карта на секциите в чужбина

от Боян Юруков
лиценз CC BY-SA

На 27-ми октомври ще се проведат избори за Народно събрание. Извън България ще може да се гласува в 719 секции на 623 места. На две от тях във Франция – Бокузе и Маринян – все още не е определен точен адрес. На 116 от останалите места ще има поне една секция, в която ще може да се гласува с машина.

Днес изпратих персонален мейл на около 3000 абонирали се за новини покрай проекта Glasuvam.org. В него всеки получи най-близките три секции до града, където са отбелязали, че е най-удобно за тях. При промяна на адресите или други детайли покрай секцията, ще пратя съпътстващо писмо с нови подробности.

Писмото, както винаги до сега, беше съпътствано с няколко важни съвета за процеса на га

  • Изборният ден започва в 7:00 сутринта местно време и свършва в 8:00 часа вечерта
  • Може да гласува всеки български гражданин независимо дали е подал заявление или не
  • Секциите отбелязани горе са актуални към 18-ти октомври. Възможно е в следващата седмица да има промени или корекции. Затова Ви препоръчвам да проверите преди изборния ден отново на картата и на сайта на МВнР.
  • Независимо от отбелязаната в заявлението Ви секция, ако сте подали такова, може да гласувате където и да е в чужбина
  • В чужбина може да гласува всеки български гражданин независимо от обичайното му пребиваване. Това означава, че ако пътувате зад граница по работа или на почивка, може да упражните гласа си в близка до Вас секция. Отново, няма значение дали сте подавали заявление.
  • Ако все пак сте в България по време на изборите, може да гласувате само по постоянен адрес. Тогава попълвате приложение 22, че не сте гласували в чужбина и са длъжни да Ви отбележат. Присъствате в списъка и след името Ви е отбелязано МВнР.
  • В чужбина за Народно събрание има възможност да гласувате само за партия/коалиция. Възможност за преференции, каквито има в страната, няма. Причината за това е ефективното блокиране на МИР Чужбина от една страна и липсата на дистанционно гласуване от друга. Така гласът Ви помага на шанса за парламентарно представяне. Запознайте се също с бюлетината
  • Препоръчвам да се гласува с машина, където това е възможно. Гласуването с машина гарантира, че гласът Ви ще бъде преброен и няма шанс да бъде отбелязан като невалиден.
  • Препоръчвам да се гласува възможно най-рано, тъй като опитът показва, че с хартиено гласуване с напредването на деня стават струпвания на някои места. Ако имате съмнения и спомени за такива и имате друга близка секция с по-малко натоварване, препоръчваме да отидете там. На картата на Glasuvam.org може също да споделяте и преглеждате обратна връзка от други колко са чакали на това място.

Не на последно място, когато приключи някой в чужбина с гласуването, независимо дали се е абонирал или не, има възможност да отбележи на картата при секцията, в която е упражнил правото си на глас колко време му е отнел целия процес. Това дава възможност на тези след него да знаят, че се минава бързо или се въоръжат с търпение.

Повече за проекта в помощ за гласуване, както и подобни статии за предходни избори, ще намерите в архива.

The post Избори октомври 2024 – карта на секциите в чужбина first appeared on Блогът на Юруков.