Последний раз о технологических аспектах организации переписи и обработки ее результатов "Известия" писали больше года назад. На отечественном IT-рынке тогда происходили весьма интересные события, главным из которых стал выигранный судебный иск компании ABBYY к Госкомстату по итогам тендера на право обработки переписных листов. К настоящему времени эта обработка не завершена. Госкомстат утверждает, что уложится в положенный срок - в I квартал 2004 года.
Принципиальное различие между технологиями конкурировавших за подряд на обработку результатов переписи компаний "КРОК" и уже упомянутой ABBYY состояло в следующем. Форма переписного листа, утвержденная Госкомстатом, предполагала повторную ручную процедуру - кодирование. На основании словесных рукописных сведений, не подлежащих машинному распознаванию, кодировщик заполнял дополнительный бланк. ABBYY уверяла, что может обеспечить при условии изменения формы переписного листа полную автоматизацию процесса распознавания. Несмотря на решение суда об отмене результатов выигранного "КРОКом" тендера, Минэкономразвития приняло решение о передаче подряда компании "КРОК", поскольку проведение нового конкурса ставило под угрозу утвержденные президентом сроки переписи.
"КРОК" применила сканеры ДС-300 отечественного производства и Fujitsu, а также программное обеспечение, созданное специально "под перепись". И то и другое настораживало. Программное обеспечение для распознавания символов (OCR) никогда не было специализацией компании - в отличие от ABBYY, которая в этом классе программных продуктов одна из лучших в мире. Сканер - техника настолько сложная, что использовать аппарат, не прошедший проверки массовым применением, казалось опасным. Однако обошлось. Софт разработали специалисты, ранее сделавшие хотя и неплохой, но не получивший коммерческого успеха OCR-продукт Auto Reader. Официально объявленный результат вызывает удивление: 99,967% успешного распознавания. Отечественная техника тоже справилась. Сканирование прошло, по словам представителя компании, "без авралов". Генеральный директор "КРОКа" Борис Бобровников комментирует итоги проекта торжественно: "Каждый раз, когда нас выбирают для реализации проектов общероссийского масштаба, мы испытываем гордость и ответственность. Тем больше стремление создать решение, сокращающее материальные и временные затраты в масштабе страны. Я очень рад, что разработанная "КРОКом" система "Свод М1" и в будущем будет полезна для решения задач ведомства".
По словам статс-секретаря, заместителя председателя Государственного комитета Российской Федерации по статистике Сергея Колесникова, достоверность сведений, полученных после обработки переписных листов, связана не только с качеством распознавания. "Некоторые проблемы" при сведении данных "в большие массивы" имеют место.
Председатель Госкомстата Владимир Соколин сетует на отставание от графика выполнения работ, вызванное задержкой из-за тяжбы по поводу результатов тендера. Он признает: "Мы столкнулись с большими трудностями по их (данных, полученных после сканирования. - "Известия") обработке. К сожалению, программное обеспечение создается на ходу". К "КРОКу" это отношения, впрочем, уже не имеет. Компания выполнила условия контракта.
Председатель Госкомстата видит стратегическую задачу в том, чтобы организовать регулярный сбор первичных статистических данных в машиночитаемом виде. Техника стоимостью $10 млн, задействованная для переписи, остается в распоряжении ведомства. Будет ли расформировано специальное управление, созданное для проведения мероприятия? "Посмотрим, у нас организационная структура гибкая", - говорит по этому поводу Сергей Колесников. По его же словам, 14-томная публикация итоговых таблиц может занять не один год, хотя "мы постараемся сделать это быстрее".
Есть основания полагать, что результаты переписи уже доступны на "черном" рынке информации. В пользу предположения говорит, например, сообщенный читателем случай: персональное предвыборное обращение пришло гражданину на адрес, по которому он случайно находился во время переписи.