Вибори і відкриті дані в України: поступ і пропозиції

Фото: Вибори і відкриті дані в України: поступ і пропозиції

Наразі триває робота над змінами до Виборчого кодексу. Але реформи потребує не лише законодавство, а й сайт Центральної виборчої комісії, який містить важливий масив даних. Саме аналіз даних може дати розуміння того, як варто змінювати виборче законодавство — яким має бути поріг виборчої квоти, чи потрібний другий тур у малих громадах, до якого рівня громад спускати партійність.

А для того, щоб аналізувати дані якісно, вкрай необхідно, щоб вони були на сайті ЦВК у максимально зручному форматі. І для цього Центральна виборча комісія повинна мати відповідні ресурси.

За останні два роки мені вдалося попрацювати з даними офіційного сайту за три виборчі цикли — президентський, парламентський (2019) та місцевий (2020). Щоразу доводиться зіштовхуватися з підводними каменями.

Але спочатку варто згадати і позитивні зміни.

Поступ у виборчих даних 

У липні 2019 року ЦВК вперше оприлюднила фото кандидатів-мажоритарників на заклик Руху ЧЕСНО. Це спростило роботу для журналістів-розслідувачів — стало легше шукати клонів-двійників у соцмережах, а також ми дізналися, як виглядають такі кандидати, як Дарт Вейдер. 

На місцевих виборах 2020 року на сайті ЦВК вперше з'явилися відкриті дані кандидатів і обраних депутатів — поки що лише у форматі XML/XSD. 

Це не найкращий варіант для швидкого читання, але це краще, ніж, наприклад, отримання даних за протоколом SOAP, як це пропонує Державний реєстр виборців. І, звісно, краще, ніж нічого. 

До цього моменту всі аналітики політичних даних займалися тим, що витягували дані з сайту ЦВК. Часом це було непросте випробування. Ось короткий відгук нашого колишнього аналітика даних Антона Кривка щодо стягування даних по місцевих виборах (ми почали це робити ще до того, як ЦВК оприлюднила дані в XML):

“По-перше, на сайті відсутнє API та будь-які дампи даних. По-друге, сторінки з таблицями зверстані таким чином, щоб зробити скрепінг максимально болючим. Це змусило писати складніші CSS-селектори. По-третє, партії, від яких балотуються кандидати, вказані не окремим стовпчиком, а на початку списку на весь рядок. Для читання інформації користувачам це, певно, зручно (якщо список не надто довгий), але скрепер не знає, коли закінчився список однієї партії та почався список наступної. Довелося майструвати “милицю” — брати з окремої таблиці кількість кандидатів і заповнювати назвою партії відповідну кількість рядків”.

Цей метод можна вже не застосовувати для виборів 2020 року через наявність XML, де кандидати прописуються під партією, але проблема залишається, коли ми говоримо про вибори 2015 і 2010 років, де всі дані треба скрепити. 

Скріншот з сайту ЦВК, вибори 2010 року 

Відповідно, у міжвиборчий період цю проблему можна спробувати вирішити, якщо ЦВК отримає достатньо фінансових ресурсів.

До речі, якщо є потреба завантажити дані з сайту ЦВК, то за посиланням від Руху ЧЕСНО є набір скреперів. Вони дозволяють отримати інформацію про кандидатів та результати виборів. 

На виборах 2019 року вперше з'явилися дані про фінансові виборчі фонди кандидатів і про результати голосування. 

 

Втім, дані з’явилися не одразу, а для аналізу кандидатів все одно довелося писати скрепери. 

Форма кандидата 

Під час подачі документів кандидати подають коротку біографічну довідку. На основі цих даних можна сформувати соціальний портрет кандидата та члена виборчої комісії.


Приклад портрету члена окружної виборчої комісії

Ось які зміни варто було б інтегрувати: 

  1. Позначка статі 

Додати під час маніпуляцій з даними стать кандидата не так вже і складно: у біографіях є ключове слово “громадянка України” — в такому разі ми присвоюємо жіночу стать тим, хто має закінчення -ка. Втім, це не вбереже від одруківок і помилок. Значно розумніше просити кандидатів поставити галочку навпроти потрібної статі. 

  1. Місце роботи

Кандидати також зазначають у довідці місце роботи та посаду, якщо така є. Якщо немає, то вказують, що вони безробітні, тимчасово безробітні, не працюють, а також десятки інших форм. Відсутність роботи теж можна було б звести до єдиного варіанту, запропонувавши кандидату просто поставити хрестик, якщо вони не працюють. На скріні нижче можна побачити все різноманіття написання.

 

Запропонувати можливість ставити позначку у відповідному полі, якщо кандидат бажає вказати місцем роботи “фізична особа — підприємець”. На місцевих виборах 2020 року ми зафіксували близько 300 способів запису цих трьох слів.

Утім, ФОП — це надто широко для того, щоб зрозуміти, яка категорія громадян балотується на виборах (або йде в комісії). Трохи допомогти із розумінням міг би головний КВЕД ФОПа — тоді стало б зрозуміліше, чим саме кандидати займаються. 

Можна піти далі — і запропонувати поле, де потенційні кандидати будуть прописувати код ЄДРПОУ підприємства, де вони працюють. Але таку вимогу мають передбачити законотворці. Це допомогло б у пошуках двійників або підставних кандидатів, а також суттєво додало б інформації до портрету. 

Подібна історія стосується і тих випадків, коли кандидати вказують, що вони є пенсіонерами, директорами та приватними підприємцями. Звичайно, ЦВК не може запропонувати форми для всіх місць роботи, але привести до ладу найпопулярніші категорії — цілком. 

Зникнення даних 

Також при роботі з місцевими виборами 2020 року помітила, що дані про кандидатів та обраних депутатів зникали з сайту ЦВК (скоріше за все, ці кандидати знялися). Відслідкувати це складно, бо немає жодного опису змін чи дампів даних.

Передбачаю також незручність, яка стосувалася і місцевих виборів 2015 року: зі списку обраних депутатів зникають без згадки депутати, які вирішили скласти повноваження. За даними 2015 року необхідно зайти на окрему сторінку “Обрані депутати місцевих рад, які достроково припинили повноваження або не набули їх” (у верхньому меню знаходиться функціонал розрізу — ради, партії, загальні відомості).

Наприклад, ось цих вибулих депутатів вже не буде в переліку обраних по відповідних радах. 

На порталі Верховної Ради ситуацію вирішили таким чином: у нардепа є дві дати — початку повноважень і закінчення повноважень. За необхідності аналітик фільтрує відповідні колонки. Можливо, ЦВК варто подумати про розміщення інформації про всіх депутатів в одному файлі із зазначенням дати набуття повноважень і вибуття.

Стосовно вибулих по виборах 2020 року — у форматі XML у профілях кандидатів з'явилася DATECANCEL. Але окремої колонки щодо вибуття депутата у розрізі рад поки немає.

 

Виборчі комісії

Окремої уваги заслуговує розділ сайту ЦВК, де міститься інформація про виборчі комісії і членів цих комісій. Ці дані дають можливість зрозуміти, яка ситуація з розподілом квот у комісіях і як відбувається призначення керівного складу, що підписує протоколи з результатами виборів. 

Ці дані говорять законодавцям про те, що залишати неврегульованим питання призначення керівного складу ТВК означає створити нерівні умови для партій. Навіть якщо вони мають гарантовану парламентську квоту

 

На сайті ЦВК наразі немає даних про склад (переліку ПІБ членів з посадами і партіями) комісій у селищних та сільських громадах. Тому ми не можемо зробити висновки про справедливий розподіл складу комісій у малих громадах. 

Не претендую на універсальний та вичерпний рецепт щодо відкритих даних для ЦВК, оскільки політику впровадження відкритих даних необхідно імплементувати в орган комплексно. Для початку — у ЦВК варто провести аудит і визначити необхідні зміни із залученням стейкхолдерів.