Распределение бюджетных ассигнований бюджета Санкт-Петербурга (по закону 2014 года)
В каждом из этих файлов данные на 2014 год и на плановый период 2015 и 2016 годов, а также данные проектов, поправок и принятых законов объединены в одну таблицу со сворачивающимися уровнями.
Также предварительно (без данных для построения этих файлов) доступны аналогичные файлы для проекта закона о бюджете 2015 года:
Распределение бюджетных ассигнований бюджета Санкт-Петербурга (по законам 2014 и 2015 годов)
Соответствие целевых статей между законами 2014 и 2015 годов частично выполнено вручную и доступно для просмотра здесь (нечётная строка = было, чётная = стало).
Далее приводится информация для тех, кто хочет получить подобные файлы самостоятельно или использовать данные, применявшиеся для их получения, иным способом.
База данных и таблицы расходов бюджета Санкт-Петербурга
Данные, использованные для построения базы, прошли несколько уровней обработки. Эти уровни пронумерованы так, что на каждом из них в качестве исходных данных используются только данные непосредственно предшествующего уровня. Список уровней:
второй, рекомендуемый вариант отчётов из базы данных — только xlsx-файлы
Так как промежуточные данные тоже представляют интерес, здесь приводятся результаты каждого этапа. На данный момент собраны данные для 2014 года.
Исходные данные
Исходными данными являются документы в том виде, в котором они были опубликованы на официальных сайтах. Документы взяты из следующих источников:
Раздел «Бюджет для граждан» сайта Комитета финансов Санкт-Петербурга, откуда использованы xlsx-файлы для таблиц расходов бюджета. Это позволяет установить, какими планировались расходы до рассмотрения в Законодательном Собрании, и какими они стали после. К сожалению, эти данные не полны.
Сайт Законодательного Собрания Санкт-Петербурга, откуда берутся документы с поправками к бюджету. Это позволяет проследить, как менялись расходы бюджета при рассмотрении в ЗС. Полученные документы были вручную преобразованы в формат odt. Короткие поправки в исходные данные не включены, они введены вручную и добавляются на следующем уровне.
На этом уровне формируются csv-таблицы, из которых далее можно будет собрать базу данных. Первая строка каждого csv-файла содержит названия столбцов. Таблицы размещены в двух каталогах:
content
Собственно таблицы из документов. В основном это таблицы с изменениями ведомственной структуры расходов бюджета.
meta
Таблицы с данными о самих документах.
Файлы каталога content содержат часть информации в своих именах (filename):
filename ::= stageYear "." documentNumber "." paragraphNumber "." tableType "." actionType [ "(" actionArguments ")" ] ".csv"stageYear ::= числоdocumentNumber ::= числоparagraphNumber ::= число { "." число }tableType ::= строкаactionType ::= строкаactionArguments ::= число { "," число }
Здесь число — последовательность из одной или более цифр, а строка — последовательность из одной или более строчных латинских букв.
Описания элементов имён файлов:
stageYear
основной год, для которого рассматривается бюджет; не является годом планового периода
documentNumber
номер документа в ЗС
paragraphNumber
номер приложения или пункта в документе
tableType
тип таблицы из документа, это может быть:
department
распределение расходов по комитетам и целевым статьям
section
распределение тех же расходов по разделам, приводится не для всех документов
actionType
тип операции, изменяющей данные расходов бюджета; соответствует виду поправки к бюджету:
set
сделать все значения для годов, указанных в аргументах, равными приведённым в таблице, отсутствующие в таблице значения убрать — в таком виде данные встречаются в первоначальной редакции бюджета
diff
прибавить значения, приведённые в таблице, к значениям, полученным в результате предыдущих операций — в таком виде данные встречаются в поправках к первоначальной редакции бюджета
diffset
отменить все операции, сделанные в документах после указанного, и прибавить значения, приведённые в таблице — в таком виде данные встречаются в поправках к изменениям бюджета
move
переместить данные, подходящие под указанный в таблице шаблон — такие операции соответствуют текстовым поправкам губернатора «Изменить подразделы, виды расходов и т. п.»
Далее рассматриваются форматы отдельных файлов.
meta/authors.csv
Авторы, которые внесли в ЗС какой-либо документ или поправку. Столбцы:
короткое имя автора для написания в узких столбцах таблиц документов, получаемых на последнем уровне
authorLongName
имя автора в том виде, в котором оно указано на сайте ЗС
meta/documents.csv
Документы — проекты законов и поправки. Столбцы:
documentNumber
номер документа в ЗС
documentDate
дата внесения документа в расширенном формате ISO (YYYY-MM-DD)
stageNumber
номер варианта закона (0 — первоначальный закон, 1 — первая корректировка, 2 — вторая и т.д.) для связи с таблицей вариантов законов
amendmentFlag
тип проекта/поправки (0 — проект, после которого идут 1 — отдельно внесённые поправки, затем 2 — прочие изменения, приводящие проект закона к конечному виду, в котором он принимается)
authorId
числовой идентификатор автора (если автор известен, для amendmentFlag=2 считается неизвестным)
documentAssemblyUrl
ссылка на документ на сайте ЗС, содержащий данные (если он там опубликован)
meta/stages.csv
Варианты законов. Столбцы:
stageYear
первый год, на который распространяется закон
stageNumber
номер варианта закона для данного года
stageAssemblyUrl
ссылка на страницу с документами, поступившими в ЗС во время рассмотрения проекта этого варианта