Если вы не программист, то вам, скорее всего, нужен один из этих двух файлов:

departments.xlsx
Ведомственная структура расходов бюджета Санкт-Петербурга (по закону 2014 года)
sections.xlsx
Распределение бюджетных ассигнований бюджета Санкт-Петербурга (по закону 2014 года)

В каждом из этих файлов данные на 2014 год и на плановый период 2015 и 2016 годов, а также данные проектов, поправок и принятых законов объединены в одну таблицу со сворачивающимися уровнями.

Также предварительно (без данных для построения этих файлов) доступны аналогичные файлы для проекта закона о бюджете 2015 года:

departments2015.xlsx
Ведомственная структура расходов бюджета Санкт-Петербурга (по закону 2015 года без данных 2014 года)
sections2015.xlsx
Распределение бюджетных ассигнований бюджета Санкт-Петербурга (по закону 2015 года без данных 2014 года)
departments2014-2017.xlsx
Ведомственная структура расходов бюджета Санкт-Петербурга (по законам 2014 и 2015 годов)
sections2014-2017.xlsx
Распределение бюджетных ассигнований бюджета Санкт-Петербурга (по законам 2014 и 2015 годов)

Соответствие целевых статей между законами 2014 и 2015 годов частично выполнено вручную и доступно для просмотра здесь (нечётная строка = было, чётная = стало).

Далее приводится информация для тех, кто хочет получить подобные файлы самостоятельно или использовать данные, применявшиеся для их получения, иным способом.

База данных и таблицы расходов бюджета Санкт-Петербурга

Данные, использованные для построения базы, прошли несколько уровней обработки. Эти уровни пронумерованы так, что на каждом из них в качестве исходных данных используются только данные непосредственно предшествующего уровня. Список уровней:

1-sources
исходные данные — документы с различных сайтов
2-tables
таблицы, извлечённые из документов
3-db
база данных, полученная из таблиц
4-xls
первый вариант отчётов из базы данных — xls- и xlsx-файлы
4-xlsx
второй, рекомендуемый вариант отчётов из базы данных — только xlsx-файлы

Так как промежуточные данные тоже представляют интерес, здесь приводятся результаты каждого этапа. На данный момент собраны данные для 2014 года.

Исходные данные

Исходными данными являются документы в том виде, в котором они были опубликованы на официальных сайтах. Документы взяты из следующих источников:

1-sources.out.zip
архив с документами

Таблицы из исходных документов

На этом уровне формируются csv-таблицы, из которых далее можно будет собрать базу данных. Первая строка каждого csv-файла содержит названия столбцов. Таблицы размещены в двух каталогах:

content
Собственно таблицы из документов. В основном это таблицы с изменениями ведомственной структуры расходов бюджета.
meta
Таблицы с данными о самих документах.

Файлы каталога content содержат часть информации в своих именах (filename):

filename ::= stageYear "." documentNumber "." paragraphNumber "." tableType "." actionType [ "(" actionArguments ")" ] ".csv"
stageYear ::= число
documentNumber ::= число
paragraphNumber ::= число { "." число }
tableType ::= строка
actionType ::= строка
actionArguments ::= число { "," число }

Здесь число — последовательность из одной или более цифр, а строка — последовательность из одной или более строчных латинских букв.

Описания элементов имён файлов:

stageYear
основной год, для которого рассматривается бюджет; не является годом планового периода
documentNumber
номер документа в ЗС
paragraphNumber
номер приложения или пункта в документе
tableType
тип таблицы из документа, это может быть:
department
распределение расходов по комитетам и целевым статьям
section
распределение тех же расходов по разделам, приводится не для всех документов
actionType
тип операции, изменяющей данные расходов бюджета; соответствует виду поправки к бюджету:
set
сделать все значения для годов, указанных в аргументах, равными приведённым в таблице, отсутствующие в таблице значения убрать — в таком виде данные встречаются в первоначальной редакции бюджета
diff
прибавить значения, приведённые в таблице, к значениям, полученным в результате предыдущих операций — в таком виде данные встречаются в поправках к первоначальной редакции бюджета
diffset
отменить все операции, сделанные в документах после указанного, и прибавить значения, приведённые в таблице — в таком виде данные встречаются в поправках к изменениям бюджета
move
переместить данные, подходящие под указанный в таблице шаблон — такие операции соответствуют текстовым поправкам губернатора «Изменить подразделы, виды расходов и т. п.»

Далее рассматриваются форматы отдельных файлов.

meta/authors.csv
Авторы, которые внесли в ЗС какой-либо документ или поправку. Столбцы:
authorId
числовой идентификатор автора для связи с таблицей документов
authorShortName
короткое имя автора для написания в узких столбцах таблиц документов, получаемых на последнем уровне
authorLongName
имя автора в том виде, в котором оно указано на сайте ЗС
meta/documents.csv
Документы — проекты законов и поправки. Столбцы:
documentNumber
номер документа в ЗС
documentDate
дата внесения документа в расширенном формате ISO (YYYY-MM-DD)
stageNumber
номер варианта закона (0 — первоначальный закон, 1 — первая корректировка, 2 — вторая и т.д.) для связи с таблицей вариантов законов
amendmentFlag
тип проекта/поправки (0 — проект, после которого идут 1 — отдельно внесённые поправки, затем 2 — прочие изменения, приводящие проект закона к конечному виду, в котором он принимается)
authorId
числовой идентификатор автора (если автор известен, для amendmentFlag=2 считается неизвестным)
documentAssemblyUrl
ссылка на документ на сайте ЗС, содержащий данные (если он там опубликован)
meta/stages.csv
Варианты законов. Столбцы:
stageYear
первый год, на который распространяется закон
stageNumber
номер варианта закона для данного года
stageAssemblyUrl
ссылка на страницу с документами, поступившими в ЗС во время рассмотрения проекта этого варианта
2-tables.out.zip
архив с таблицами

База данных

Данные без избыточности и без различных типов операций — все изменения соответствуют операции diff.

db.sql
база данных в формате sql для СУБД SQLite

Первый вариант отчётов

Данные извлечены в xls и xlsx-таблицы для просмотра.

4-xls.out.zip
архив с таблицами

Второй вариант отчётов

departments.xlsx
Ведомственная структура расходов бюджета Санкт-Петербурга
sections.xlsx
Распределение бюджетных ассигнований бюджета Санкт-Петербурга

Предыдущие версии файлов

db.v1.zip
выпуск к принятию первоначального варианта закона о бюджете 2014 года
db.v2.zip
выпуск к принятию первой корректировки закона о бюджете 2014 года

Ссылка на папку dropbox (на случай, если они поменяют ссылки).