Как сберечь цифровое наследие (2011)
В современном мире все большая часть информации создается в электронной форме, пригодной для обработки компьютерами. На носителях она фиксируется в виде последовательности нулей и единиц, поэтому такую информацию называют цифровой, хотя по смыслу она может содержать все, что угодно – и текст, и изображения, и звук. Цифровые документы в широком смысле, включая книги, фильмы, аудиозаписи, все чаще не имеют аналогов в старой, привычной нам форме. Кроме того, масса традиционных документов тоже переводится в цифровой вид: сканируются книги и архивные документы, оцифровываются старые фильмы и видеохроники. Далеко не всегда мы задумываемся, какова будет судьба всех этих массивов цифровой информации. Смогут ли наши потомки воспользоваться ими, как мы пользуемся древними рукописями или произведениями искусства? Или вся эта информация безвозвратно исчезнет вместе с устаревшими компьютерами, рассыпавшимися магнитными лентами и исцарапанными компакт-дисками, которые просто некуда будет вставить?
Одной из международных организаций, взявшихся донести до человечества важность этой проблемы, является ЮНЕСКО. Среди приоритетов ее деятельности важную роль играет сохранение цифровой информации, представляющей ценность для будущих поколений. В Стратегическом плане Программы ЮНЕСКО «Информация для всех», принятом в 2008 году, говорится: «Если не будут приняты никакие меры, многие важные документы в электронной форме в самом скором времени исчезнут или станут полностью недоступными. В результате этого коллективная память человечества будет безвозвратно утеряна. Этот вызов следует принять незамедлительно».
Очередным конкретным шагом в этом направлении послужила международная конференция «Сохранение цифровой информации в информационном обществе: проблемы и перспективы», состоявшаяся в Москве 3–5 октября 2011 г. Она была организована в рамках председательства России в Межправительственном совете Программы ЮНЕСКО «Информация для всех». Организаторами выступили Министерство культуры Российской Федерации, Федеральное агентство по печати и массовым коммуникациям, Комиссия Российской Федерации по делам ЮНЕСКО, Российский комитет Программы ЮНЕСКО «Информация для всех» и его рабочий орган – Межрегиональный центр библиотечного сотрудничества, Государственная Третьяковская галерея. Участие в конференции приняли около 150 специалистов из 37 стран. Это были руководители и ведущие специалисты крупнейших библиотек, архивов, музеев, научно-исследовательских институтов, образовательных учреждений, профессиональных ассоциаций, международных организаций, органов государственной власти, СМИ, издательств, индустрии информационных и коммуникационных технологий и других структур, связанных с вопросами сохранения цифровой информации. Республику Беларусь представлял автор этих строк.
Цели конференции ее организаторы сформулировали так:
- повышение осознания важности, масштаба и остроты проблем сохранения цифровой информации в профессиональных сообществах, на политическом уровне и среди широкой общественности;
- определение приоритетных проблемных областей, политических и профессиональных стратегий в сфере сохранения цифровой информации;
- совершенствование международной, региональной, национальной политики, законодательства и деятельности по сохранению цифровой информации;
- выявление и распространение передового опыта в перечисленных выше областях.
Общее впечатление от конференции: важность специальных мер по сохранению цифрового наследия уже осознана, хотя действовать начали далеко не все. Многие страны были представлены наблюдателями, которые активно изучали опыт тех стран, в которых уже реализуются конкретные мероприятия, задавали массу уточняющих вопросов.
Задача сохранности цифровой информации имеет два основных направления: сохранение документов, изначально созданных в электронной форме (некоторые специалисты предлагают именовать их цифророжденными) и сохранение цифровых копий традиционных документов – вместе с оригиналами, а иногда и вместо них. Оба эти направления имеют свою специфику применительно к сфере деятельности библиотек и архивов.
Для библиотек актуальны вопросы сбора и сохранения электронных публикаций, прежде всего – сетевых (размещенных на интернет-сайтах), а также цифрового копирования книг, хранящихся в библиотеках, обеспечения доступа к ним и связанных с этим аспектов авторского права. Архивистов волнуют проблемы комплектования цифророжденными управленческими документами, которые обращаются в системах электронного документооборота, а также цифрового копирования архивных фондов. При этом вопросы авторского права не являются столь критичными, как для библиотек.
Важной темой, прозвучавшей на конференции, была необходимость принятия в каждой стране национальной политики в отношении сохранения цифрового наследия. Без этого библиотеки, архивы, музеи и другие организации решают свои проблемы изолированно друг от друга, часто не имея даже представления о том, что делается у коллег из смежной отрасли. К сожалению, это пока вполне справедливо и для Беларуси: усилия библиотекарей и архивистов координируются, в лучшем случае, только в рамках локальных тематических проектов.
В качестве примера страны, где национальная политика существует и успешно реализуется, можно привести Финляндию. В ней действует программа «Национальная цифровая библиотека», в которой участвуют около 600 организаций, включая все основные библиотеки и архивы. Каждая на своем участке, они обеспечивают как перевод в цифровой вид ранее накопленных фондов, так и фиксацию вновь рождающегося цифрового контента и доступ к нему. В частности, с 2008 г. обеспечивается сохранение электронных экземпляров всех издаваемых книг, периодических изданий и цифрового аудиовещания. При этом централизованное долгосрочное хранение всего этого информационного массива обеспечивает одна организация – Национальный архив.
На конференции ощутимо преобладало обсуждение вопросов, актуальных для библиотек, прежде всего – сохранение электронных публикаций. Наибольших успехов в этом добились страны, в которых национальное законодательство об обязательном экземпляре охватывает не только традиционные, но и электронные публикации. Здесь впечатляющим примером может послужить Дания. Национальная библиотека этой страны комплектуется электронными публикациями с 1998 г. С 2005 г. реализуется масштабный проект фиксации всего цифрового контента, размещаемого на сайтах в национальной доменной зоне .dk, а также всех публикаций, имеющих отношение к Дании, в других доменных зонах. Глобальный сбор таких публикаций в автоматическом режиме осуществляется четыре раза в год. Помимо этого, работники библиотеки постоянно проводят ручной мониторинг, просматривая сайты и отбирая материалы, требующие фиксации в библиотеке. За эти годы общий объем хранимого контента превысил 236 Тбайт. Доступ к нему пока обеспечивается только в исследовательских целях, с помощью системы указателей. Датская система отчасти дублирует международный проект автоматического архивирования сайтов, реализованный создателями портала www.archive.org. Особенность заключается в том, что электронный архив Национальной библиотеки Дании находится на ее территории и под ее полным контролем.
Постоянное архивирование интернет-публикаций и цифрового вещания, относящихся к своим странам, упоминали в докладах также представители Эстонии, Германии, Египта. Это также обусловлено особенностями законодательства об обязательном экземпляре. В странах, где такое законодательство на веб-публикации не распространяется, докладчики говорили скорее не о перспективах, а о проблемах. В этом отношении показателен опыт России, в которой библиотеки по-прежнему комплектуются преимущественно бумажными изданиями, а для учета информационных систем и, теоретически, обеспечения сохранности их содержимого создана отдельная организация – Информрегистр. В такой ситуации большинство короткоживущих публикаций, размещаемых на российских сайтах или посвященных России, никак не фиксируется и исчезает бесследно. Отмечу, что попытка фиксации такого контента хотя бы по отдельным темам была предпринята несколько лет назад архивистами Центрального архива документов на электронных носителях Москвы (ЦАДЭНМ). Но эта инициатива не получила развития, а сам архив вскоре был упразднен.
Приходится констатировать, что белорусская ситуация в этом отношении схожа с российской. Законодательная база нашей страны также не обязует библиотеки фиксировать интернет-публикации, а двойная регистрация сайтов (в Государственном регистре информационных ресурсов Беларуси, осуществляемая НИРУП «Институт прикладных программных систем», и в Государственном регистре интернет-ресурсов, осуществляемая Белорусской государственной инспекцией по электросвязи) отнюдь не гарантирует сохранности их содержания. Правда, в нашей стране, в отличие от России, действует Инструкция по проведению экспертизы ценности и передаче на государственное хранение документов в электронном виде и информационных ресурсов (утверждена Постановлением Министерства юстиции от 30.06.2010 № 37), которая требует от организаций выявления обновляемых информационных ресурсов, проведения экспертизы ценности обновляемой информации, и по ее результатам, формирования в необходимых случаях архивных копий. К сожалению, на практике это требование не реализуется в отношении сетевых публикаций. Сказывается уже упоминавшееся отсутствие национальной политики, т.е. ведомственная разобщенность: архивисты и библиотекари пока так и не решили, чьей зоной ответственности является контроль за сохранением материалов, публикуемых в сети Интернет. Судя по международному опыту, это относится скорее к компетенции библиотек (или Книжной палаты), но при этом, как и в России, необходимо совершенствование законодательства об обязательном экземпляре.
Отмечу, что в архиве электронных документов БелНИЦЭД на постоянном государственном хранении находятся архивные копии нескольких сайтов. Это копии авторского сайта писателя и журналиста С. Крапивина (сформирована по его личной инициативе в 1999 году), сайта Института проблем культуры по состоянию на 2000 г. и Галереи детского творчества «Оазис» на 1999 г. (сформированы в порядке эксперимента при исследовании перспектив программно-независимого хранения информационных ресурсов), три версии сайта «Архивы Беларуси» (на июнь 2000, февраль 2001 и ноябрь 2002 г.) и копия тематической рублики «К 60-летию Победы», размещенной на этом же сайте в 2005 г. Разумеется, это лишь капля в море цифровой информации. В остальном интернет-публикации, относящиеся к Беларуси, ретроспективно доступны только в тех случаях, если их копии автоматически заархивированы сервисом www.archive.org.
На этом фоне проблема архивирования цифророжденной управленческой документации, образующейся в деятельности государственных учреждений, пока не столь актуальна. На конференции она почти не затрагивалась. Отчасти это можно объяснить «библиотечным уклоном» в составе участников. Но другая причина видится в том, что общие принципы архивирования управленческой документации достаточно отработаны, и распространить их на цифровые документы в целом проще, чем принципы библиотечного комплектования – на интернет-публикации или цифровое вещание. Во всяком случае, так представляется многим, пока большинство документов постоянного хранения либо остаются бумажными, либо существуют параллельно в бумажной и цифровой ипостасях. Но кое-где в мире уже произошел отказ от бумажного представления даже тех видов документов, которые подлежат постоянному хранению – это прозвучало, в частности, в докладе представителя Эстонии. Уже не первый год комплектуются электронными документами госучреждений архивы США, Великобритании, Австралии и ряда других стран.
Главным «подводным камнем», связанным с архивированием таких документов, является не их отбор (он действительно аналогичен отбору бумажных документов) и даже не обеспечение долгосрочной сохранности и доступности (эта проблема решается так же, как и сохранение других видов цифрового контента), а прежде всего сохранение доказательной (юридической) силы после извлечения цифровых документов из породивших их систем. Специфика здесь в том, что цифровой код не связан навечно с конкретным носителем, и потому в него можно вносить нераспознаваемые изменения, в том числе и на стадии хранения.
В конечном счете – это вопрос доверия к содержащейся в документах информации, т.е. вопрос не технический, а скорее психологический. Раньше всех к комплектованию цифровыми документами перешли архивы тех стран, где действует «презумпция доверия» – информация считается достоверной, если не доказано обратное. Именно в силу этого они не склонны диспутировать проблемы, связанные с подтверждением достоверности: пока «обратное» не случилось, обсуждать просто нечего. Там же, где в общественном мнении господствует «презумпция недоверия» (информации можно верить, только если доказана невозможность ее подделки), переход к электронному документообороту требует создания дорогостоящей инфраструктуры для выработки и проверки цифровых подписей, а архивное хранение – создания надежно защищенных цифровых хранилищ. Пока вопросы надежности и долговечности защитных средств бурно обсуждаются (часто на уровне бытовых «страшилок»), с отказом от бумажных документов длительных сроков хранения не спешат, и потому в электронные архивы принимать просто нечего. Этим объясняется и недолгое существование ЦАДЭНМ в России, и отсутствие фондов госорганов в электронном архиве БелНИЦЭД.
Но время не стоит на месте, и постепенно в электронный документооборот вовлекаются госучреждения всех стран. Можно уверенно предсказать, что в скором времени проблемы сохранения управленческих электронных документов выйдут на первое место в сообществе архивистов. Важность этой темы отметил в своем выступлении заместитель главы Федерального архивного агентства России О. В. Наумов. Российские архивисты сейчас определяют основные принципы комплектования электронными документами: должно ли оно осуществляться каждым традиционным архивом или специализированным учреждением. Как и в Беларуси и Украине, предпочтение отдается централизованному варианту, предполагающему создание специализированного Центра хранения электронных документов, в котором на основе новейших технологий обеспечивалась бы работа с электронными документами и резервным фондом цифровых копий. Многие функции этого центра будут аналогичны тем, которые в нашей стране выполняет БелНИЦЭД.
Как свидетельствует тематика конференции, внимание архивистов пока больше сосредоточено на вопросах цифрового копирования традиционных документов, уже хранящихся в архивах. Если копирование книжной продукции направлено прежде всего на обеспечение доступа (и именно потому столь актуальна проблема авторского права), то для архивов, а также рукописных отделов библиотек первостепенную роль играет возможность обеспечить лучшую сохранность оригиналов, обычно существующих в единственном экземпляре. Впрочем, легкость доступа к архивной информации не менее важна в мире, где все большее число потребителей предпочитает искать интересующие сведения исключительно в Интернете. То, что там не представлено, для них как бы не существует вовсе. В своем выступлении я упомянул случай, когда один молодой человек обратился ко мне за советом: при изучении увлекшей его темы он перерыл множество сайтов, но ряд вопросов так и остался без ответов. Я посоветовал ему обратиться в библиотеку. Вскоре он прислал мне по электронной почте восторженное письмо, в котором благодарил за столь ценный совет: там оказалось столько всего интересного! Несомненно, в будущем число таких людей будет неуклонно возрастать, а число тех, кто способен дать им такой совет – сокращаться. В перспективе все материалы, не оцифрованные и не выставленные в Интернете, могут оказаться просто забытыми, независимо от того, сколько усилий мы потратим на их сохранение.
Учитывая эту тенденцию, свое выступление я посвятил опыту создания Фонда цифровых копий архивных документов в белорусских архивах. Общий его объем к началу 2011 г. составил 755 Гбайт и почти полтора миллиона оцифрованных страниц, или более 7 тысяч дел и 44 тыс. кино-, фоно- и фотодокументов. Впрочем, это составляет пока менее одной тысячной от общего количества документов, находящихся на архивном хранении. Эта же тема прозвучала в докладе директора Архива Российской академии наук В. Ю. Афиани. В возглавляемом им архиве объем оцифрованных документов составляет 139 Гбайт. Впечатляюще звучали цифры по количеству рукописей, оцифрованных в некоторых библиотеках. Например, в Индии в рамках создания цифрового депозитария культурного наследия оцифрованы 252 тыс. древних манускриптов.
Сегодня во многих библиотеках и архивах накоплены уже столь огромные массивы цифровой информации, что ее сохранение требует построения мощных и дорогостоящих систем, способных оперировать сотнями терабайт. Примеры таких систем приводились представителями Александрийской библиотеки (Египет) и Национальной библиотеки Италии. Подобные же системы промышленного уровня либо создаются, либо будут созданы в скором времени во многих странах. Как правило, они предусматривают хранения цифровой информации в двух вариантах – неприкосновенный экземпляр должен помещаться в так называемый «темный» архив, оптимизированный для максимально надежного и минимально затратного хранения. Наиболее востребованная часть этой же информации может находиться в «светлых» архивах – менее надежных, но ориентированных на интересы потребителя, на максимально удобный доступ. Отмечу, что именно такой подход реализован и при хранении Фонда цифровых копий в нашей стране: роль «светлых» архивов играют архивы-владельцы бумажных оригиналов, роль «темного» архива – БелНИЦЭД. Надежность хранения еще более повысится в случае реализации проекта модернизации архива электронных документов БелНИЦЭД, который включен в государственную программу «Архивы Беларуси» на 2011–2015 годы.
Важное свойство цифровой информации заключатся в том, что длительное сохранение больших ее объемов требует весьма существенных затрат, притом не разовых, а постоянных. Чем больше и чем дольше мы храним, тем дороже нам это обходится. В какой-то момент у общества может не оказаться нужных средств, и именно это вызывает наибольшую обеспокоенность специалистов. Поэтому продолжается поиск новых решений, которые позволяли бы хоть на какое-то время оставлять цифровую информацию предоставленной самой себе.
Одно из возможных решений предложил в своем докладе представитель Научно-исследовательского центра репрографии в Туле (Россия) С. Н. Клещарь. Сегодня существуют технологии, которые позволяют выводить цифровую информацию на обычную микропленку в виде двухмерных штрих-кодов. В хранилище с постоянным температурно-влажностным режимом такая пленка может храниться в течение нескольких столетий, не требуя постоянных затрат на обслуживание, перезапись на новые носители и т.п. В нужный момент информацию можно считать с помощью обычного сканера, как это сегодня делается в отношении штрих-кодов на товарах в магазинах, и вновь ввести ее в память компьютера. Возможно, именно такая реализация «темного» архива окажется в конце концов магистральным решением, но говорить об этом пока рано.
Показательно не только то, о чем говорилось на конференции, но и какие сюжеты на ней не прозвучали. Один из них – активно обсуждаемая в среде IT-специалистов перспектива перехода на так называемые «облачные» сервисы,или PaaS-решения (Preservation as a Service – хранение как услуга), когда сохранность цифровой информации обеспечивают не ее владельцы, а мощные центры обработки данных, предоставляющие эту услугу в онлайновом режиме. Судя по всему, национальные ведомства, ответственные за хранение архивной и библиотечной информации, пока предпочитают сохранять полный контроль над своими информационными ресурсами. Возможно, это тоже вопрос психологии, и со временем очевидная экономичность PaaS-решений заставит посмотреть на них более внимательно.
В целом конференция, несомненно, достигла поставленных целей. Важность сохранения цифрового наследия была еще раз подчеркнута в присутствии большого числа журналистов, правительственных чиновников России, специалистов из разных стран. Отчетливо наметились приоритеты, связанные с совершенствованием законодательной базы и выработкой национальных политик в этой области. Это было особо подчеркнуто в итоговом документе под названием "Московская декларация по сохранению цифрового наследия", принятом на заключительном пленарном заседании. Международный опыт, представленный представителями библиотек и архивов, наверняка будет активно востребован. Этому будет способствовать и то, что организаторы планируют издать материалы конференции на русском и английском языках.