Библиотечное сообщество находится в процессе фундаментального перехода от записе-ориентированной парадигмы MARC к граф-ориентированной модели связанных данных (Linked Data), и IFLA LRM стала концептуальным фундаментом этой трансформации. Принятая в 2017 году, модель объединила три предшествующие модели семейства FR (FRBR, FRAD, FRSAD) в единую иерархическую структуру из 11 сущностей. К февралю 2026 года Библиотека Конгресса перевела более 300 каталогизаторов на работу в BIBFRAME, Национальная библиотека Швеции полностью перешла на связанные данные ещё в 2018 году, а BnF опубликовала свыше 650 миллионов RDF-триплетов. Россия, однако, находится на ранней подготовительной стадии: рабочая группа по Национальной модели связанных библиографических данных была создана в 2021 году, но после первых заседаний публичная активность не прослеживается.
От карточного каталога к графу знаний: эволюция концептуальных моделей IFLA
История IFLA LRM начинается с модели FRBR (Functional Requirements for Bibliographic Records), одобренной в 1998 году и впервые предложившей разделение библиографической вселенной на четыре уровня: Произведение (Work), Выражение (Expression), Воплощение (Manifestation) и Экземпляр (Item) — иерархию WEMI. Модель FRAD (Functional Requirements for Authority Data, 2009) расширила описание авторитетных данных, а FRSAD (Functional Requirements for Subject Authority Data, 2010) — тематический доступ. Однако уже к моменту финализации FRAD и FRSAD стало очевидно, что три самостоятельные модели создают барьеры для внедрения из-за дублирования и несогласованности.
В 2013 году на конгрессе IFLA в Сингапуре была учреждена Консолидационная редакционная группа (CEG) в составе Пэт Рива, Патрика Ле Бёфа и Майи Жумер, которой поручили создать единую модель. После мирового рецензирования (февраль–май 2016) и переименования из «FRBR-LRM» в «IFLA Library Reference Model» документ был окончательно одобрен Комитетом по стандартам IFLA 18 августа 2017 года. Текущая версия включает поправки от декабря 2017 года и содержит 103 страницы. Русский перевод выполнен сотрудниками РНБ (Е.Л. Вороненкова, К.А. Эсман) и опубликован в сентябре 2021 года.
Принципиальное отличие LRM от предшественников — иерархическая структура с наследованием. Все 11 сущностей подчинены суперклассу Res (от лат. «вещь»), заменившему сущность Thema из FRSAD. Группа 3 FRBR (Концепция, Объект, Событие, Место) была упразднена как набор отдельных сущностей: любая сущность может быть предметом произведения через отношение LRM-R12 (Work → has as subject → Res). Корпоративные органы и семьи из FRAD объединены в сущность «Коллективный агент» (Collective Agent, LRM-E8), а многочисленные атрибуты FRBR преобразованы в отношения с сущностями «Место» (Place, LRM-E10) и «Хронологический период» (Time-span, LRM-E11). Модель определяет 37 атрибутов и 36 типов связей, а также вводит пятую пользовательскую задачу — «Исследовать» (Explore), поддерживающую навигационный поиск и случайные открытия.
Технологическая экосистема: от абстрактной модели к работающим онтологиям
Реализация IFLA LRM в формате связанных данных опирается на стек технологий W3C Semantic Web: RDF (модель данных в виде триплетов «субъект — предикат — объект»), SPARQL (язык запросов к RDF-хранилищам), OWL/RDFS (языки описания онтологий) и SKOS (система организации контролируемых словарей). На этом фундаменте построено несколько конкурирующих, но взаимосвязанных стандартов.
BIBFRAME (Bibliographic Framework), разработанный Библиотекой Конгресса, является наиболее масштабной реализацией. В декабре 2025 года вышла версия 3.0, включившая в себя онтологию исполнительской музыки (PMO). BIBFRAME использует упрощённую трёхуровневую модель: bf:Work (объединяющий LRM Work и Expression), bf:Instance (аналог LRM Manifestation) и bf:Item. Это сознательное упрощение облегчает практическое внедрение, но создаёт проблемы при маппинге с полной моделью WEMI. Для связывания произведений между собой BIBFRAME вводит концепцию bf:Hub — агрегирующий класс, не имеющий прямого аналога в LRM.
RDA (Resource Description and Access) — правила каталогизации, наиболее полно реализующие LRM. Проект 3R (Restructure and Redesign), запущенный в октябре 2016 года, полностью перестроил RDA Toolkit в соответствии со структурой LRM. Официальная версия нового Toolkit стала доступна 15 декабря 2020 года. Все сущности LRM (кроме Res) представлены в RDA как классы, атрибуты и связи — как свойства (properties) в формате RDF. Реестр RDA (rdaregistry.info, текущая версия v5.4.11) публикует все элементы как связанные данные под лицензией CC BY 4.0, с пространствами имён rdaw:, rdae:, rdam:, rdai:, rdaa: для элементов каждой сущности. Период официального внедрения RDA через PCC установлен с мая 2024 по апрель 2027 года.
LRMoo — объектно-ориентированная формализация LRM, спроектированная как расширение музейной онтологии CIDOC CRM (ISO 21127). Версия 1.0 одобрена в апреле 2024 года и согласована с CIDOC CRM v7.1.3. LRMoo определяет 16 классов и 37 свойств, обеспечивая интеграцию библиотечных и музейных данных в единое семантическое пространство. Она заменяет FRBRoo v2.4 (2016) и одобрена совместно IFLA и ICOM — уникальный случай двойного стандарта.
Среди других значимых словарей и онтологий: Schema.org (расширения для библиографических данных через SchemaBibEx — типы Periodical, PublicationIssue, Book и др.), Dublin Core (базовые метаданные), MADS/RDF (авторитетные данные LC), FOAF (описание персон), OpenWEMI (минималистичный словарь WEMI для использования за пределами библиотек) и Wikidata (активные исследования 2024–2025 гг. по выравниванию библиографической онтологии Wikidata с IFLA LRM).
Мировая практика: кто уже перешёл на связанные данные
Наиболее масштабной реализацией является программа Библиотеки Конгресса США. К маю 2025 года более 300 каталогизаторов (от Вашингтона до Нью-Дели) работают в BIBFRAME-редакторе Marva, описывая материалы на более чем 400 языках и 30 письменностях. В июле 2025 года LC перешла с ILS Voyager на открытую платформу FOLIO, при этом каталогизаторы продолжали работу в Marva без перерыва. Весь каталог LC конвертирован в BIBFRAME и доступен через сервис id.loc.gov. LC сохраняет параллельное производство MARC-записей для совместимости с мировым сообществом — стратегия «двойного выхода».
Национальная библиотека Швеции стала первой в мире национальной библиотекой, полностью перешедшей на связанные данные. Система LIBRIS XL, запущенная 11 июня 2018 года, основана на BIBFRAME 2.0 и хранит данные в формате JSON-LD. Более 600 библиотек используют систему, а национальная библиография доступна под лицензией CC0.
Bibliothèque nationale de France развивает проект data.bnf.fr с 2011 года. Структура данных основана на IFLA LRM, реализует иерархию WEMI, и к настоящему времени содержит свыше 650 миллионов RDF-триплетов. BnF применяет полуавтоматическую кластеризацию: поскольку менее 8% из 15 миллионов каталожных записей имели явное описание на уровне произведения, алгоритмы на основе нечёткого сопоставления строк группируют воплощения вокруг произведений. Открытый SPARQL-эндпоинт доступен по адресу data.bnf.fr/sparql, данные выгружаются в форматах RDF-XML, JSON-LD, N-Triples.
Deutsche Nationalbibliothek публикует все национальные библиографические метаданные и авторитетный файл GND в формате RDF с 2010 года под лицензией CC0. В сентябре 2025 года запущен бета-версия SPARQL-сервиса. GND содержит перекрёстные маппинги к LCSH, RAMEAU, MeSH и другим тезаурусам, а также координаты из GeoNames.
OCLC развивает программу WorldCat Entities: более 150 миллионов сущностей (произведения, персоны, организации, места, события, концепции), а свыше 500 миллионов URI интегрированы в MARC-записи WorldCat как мостовая стратегия. Платформа OCLC Meridian обеспечивает управление сущностями, а BIBFRAME-редактор находится в разработке.
Share—VDE (Shared Virtual Discovery Environment) — международный консорциум, включающий Библиотеку Конгресса, Национальную библиотеку Норвегии, Стэнфорд, Чикагский университет и другие институции. Платформа конвертирует MARC-данные в сущностную модель BIBFRAME, создавая кластерную базу знаний (CKB). Редактор сущностей JCricket позволяет совместную курацию данных.
Среди других значимых проектов: Национальная библиотека Финляндии (адаптация BIBFRAME для финских библиотек — модель BFFI, разделяющая bf:Work на уровни Work и Expression в соответствии с LRM), Национальная библиотека Сингапура (семантический граф знаний на 6 миллионов сущностей на базе GraphDB, запущенный в декабре 2022), BNE Испании (datos.bne.es), а также коммерческая система Axiell Quria — первая нативно связанные данные библиотечная система, работающая с 2017 года в 200+ библиотеках Скандинавии, Германии и Швейцарии.
Россия: начало пути с неопределёнными перспективами
Российское библиотечное сообщество находится на ранней подготовительной стадии перехода к связанным данным. Ключевым событием стало создание в 2021 году Рабочей группы по разработке и внедрению Национальной модели связанных библиографических данных по инициативе Б.Р. Логинова (Центр ЛИБНЕТ) при поддержке секций 08/11 и 21 РБА и Международного каталогизационного комитета.
На первом (15 июля 2021) и втором (12 октября 2021) заседаниях группы были представлены доклады, охватывающие широкий спектр вопросов: В.В. Скворцов предложил модель представления библиографических данных в LOD, О.Н. Жлобинская проанализировала зарубежный опыт и возможности формата RUSMARC для LOD, В.А. Серебряков (РАН) рассказал об опыте применения RDF-технологий, О.А. Лавренова (РГБ) — об опыте представления ББК в LOD. Важным вкладом стала презентация русского перевода IFLA LRM (В.В. Барсукова и К.А. Эсман из РНБ) и анализ терминологических проблем перевода (И.Ю. Асеева и Т.А. Бахтурина). Материалы размещены на сайте ЛИБНЕТ (nilc.ru), видеозаписи — на YouTube-канале ЛИБНЕТ.
Однако после 2021 года публичная активность рабочей группы не прослеживается. Не обнаружено свидетельств последующих заседаний, финализированной национальной модели или практических рекомендаций. Это существенный пробел, объяснимый, вероятно, сочетанием геополитических факторов и ограниченности ресурсов.
Научно-исследовательская база, тем не менее, формировалась на протяжении более чем десятилетия. О.Н. Жлобинская ведёт работу по интеграции RUSMARC и LOD с 2012 года, включая доклады на LIBNET-2012 и LIBNET-2013 о представлении авторитетных данных в Semantic Web. В.В. Скворцов анализировал модель BIBFRAME и модели библиографической информации в RDF. О.Н. Шорин (РНБ) опубликовал в журнале «Библиотековедение» (2015) результаты пилотного проекта по сбору, обработке и хранению библиографических записей с использованием технологий Semantic Web — были разработаны доменная онтология, модули взаимодействия с АБИС, конвертеры в RDF и механизм публикации в LOD.
Национальный библиографический ресурс (НБР), запущенный в 2021 году совместно РГБ (текущая библиография) и РНБ (ретроспективная библиография до 2020 года), формируется на платформе НЭБ и использует формат ISO 2709 (RUSMARC). Сводный каталог библиотек России (СКБР) также остаётся полностью MARC-ориентированным. Публичные планы перехода РГБ или РНБ на связанные данные не обнаружены. Не существует инструмента конвертации RUSMARC → RDF/BIBFRAME, аналогичного marc2bibframe2 Библиотеки Конгресса, и нет открытого портала связанных данных, сопоставимого с data.bnf.fr или id.loc.gov.
Среди ключевых российских экспертов в области связанных библиографических данных: Б.Р. Логинов (ЛИБНЕТ, общая стратегия), О.Н. Жлобинская (RUSMARC/LOD), В.В. Скворцов (BIBFRAME, RDF-моделирование), О.А. Лавренова (РГБ, ББК в LOD), В.А. Серебряков (РАН, RDF-технологии), О.Н. Шорин (РНБ, семантическая интеграция), К.А. Эсман и В.В. Барсукова (РНБ, перевод IFLA LRM).
Пять измерений сложности: почему переход от MARC к связанным данным занимает десятилетия
Переход от MARC к связанным данным — это не техническая модернизация, а смена парадигмы описания: от строк к сущностям, от записей к графу. Филип Шрейер (Стэнфорд) точно сформулировал проблему: «Несмотря на то что MARC позволил нам перенести данные в компьютерную эпоху, всё, что он на самом деле сделал — реконструировал каталожную карточку на экране. Для машины эти данные семантически неартикулированы».
Техническая конвертация MARC → BIBFRAME остаётся несовершенной и неизбежно с потерями. Инструмент LC marc2bibframe2 генерирует отдельный URI произведения для каждой MARC-записи, не выполняя кластеризацию связанных записей. Выходные данные содержат почти исключительно литеральные значения, а не URI-ссылки — необходимый этап реконсиляции (замены строковых значений на идентификаторы сущностей) не автоматизирован. Рабочая группа PCC по конвертации BIBFRAME-в-MARC (ноябрь 2024) документировала множественные сценарии потери информации при обратной конвертации: имена без подполей, заголовки без структуры, данные на нелатинских письменностях, нарушение порядка предметных рубрик.
Масштаб задачи миграции устрашает. BnF оценила, что ручное создание описаний уровня произведения для 15 миллионов каталожных записей, при затрате 2 минут на документ, потребовало бы 45 лет непрерывной работы. OCLC WorldCat содержит сотни миллионов записей. Ретроспективное обогащение — замена строковых представлений сущностей (например, «Shakespeare, William, 1564–1616») на машиночитаемые URI (например, viaf.org/viaf/96994048) — должно быть выполнено для всех унаследованных записей.
Организационный барьер не менее значим. Канадское исследование готовности (2022, опубликовано в Cataloging & Classification Quarterly) выявило, что знание BIBFRAME среди каталогизаторов низкое, и большинство библиотек «не знают достаточно о BIBFRAME, чтобы рассматривать планирование перехода». Дискуссия OCLC Research Library Partnership (2025) показала, что у метаданных-менеджеров «мало времени думать о связанных данных» — приоритетом остаётся внедрение новых библиотечных платформ. Успех LC (300 каталогизаторов за год) демонстрирует осуществимость масштабного обучения, но требует ресурсов уровня национальной библиотеки.
Проблема интероперабельности может оказаться наиболее коварной. Осма Суоминен (Национальная библиотека Финляндии) предупредил: библиотеки рискуют перейти «от MARC-силосов к силосам связанных данных» из-за множества несовместимых моделей — BIBFRAME, Schema.org, RDA Registry, Dublin Core, EDM, LRMoo. Структурное несовпадение BIBFRAME (три уровня: Work≈Work+Expression, Instance, Item) с полной иерархией WEMI в LRM/RDA создаёт системные трудности при маппинге. Ричард Уоллис (2024) указал на фундаментальное противоречие: «BIBFRAME по-прежнему говорит преимущественно с библиотечным сообществом», тогда как внешний мир ориентируется на Schema.org.
Практически все крупные институции выбрали стратегию постепенного перехода с длительным гибридным периодом. «Linky MARC» — обогащение MARC-записей URI-ссылками на сущности — выступает мостовой технологией (OCLC интегрировала 500+ млн URI в WorldCat). LC каталогизирует в BIBFRAME, но продолжает выдавать MARC для распространения. Национальная библиотека Сингапура продемонстрировала альтернативный подход: семантический граф знаний создаётся поверх существующих систем каталогизации, не заменяя их.
Куда движется библиотечная экосистема метадаты
Переход от MARC к связанным данным на основе IFLA LRM — процесс, сопоставимый по масштабу с переходом от карточного каталога к MARC в 1980–1990-х годах, и, вероятно, потребует нескольких десятилетий. Ни одна институция не установила дату вывода MARC из эксплуатации. Тем не менее, траектория движения необратима: LC, крупнейший производитель каталогизационных записей в мире, уже работает в BIBFRAME; OCLC интегрирует сущности в WorldCat; RDA полностью перестроена по модели LRM.
Для России критически важным является осознание того, что окно возможностей для формирования национальной стратегии сужается. Международное сообщество стремительно формирует инфраструктуру связанных данных, и чем позднее Россия включится в этот процесс, тем сложнее и дороже будет интеграция. Первоочередными задачами представляются: возобновление работы группы по Национальной модели, разработка конвертера RUSMARC → RDF, создание открытого пилотного SPARQL-эндпоинта хотя бы для части НБР, и подготовка программы обучения каталогизаторов основам сущностно-ориентированного описания.
Новый фактор — искусственный интеллект. Share-VDE экспериментирует с RAG-дополненными LLM, обученными на данных BIBFRAME; OCLC исследует AI-генерацию метаданных для ускорения реконсиляции сущностей. Эти технологии способны радикально снизить стоимость перехода, но также создают новые вопросы о провенансе и качестве данных. Библиотеки, уже работающие со связанными данными, окажутся в значительно лучшей позиции для использования AI-инструментов, поскольку семантически структурированные данные — естественная среда для машинного обучения, в отличие от плоских MARC-записей.
Настоящая статья подготовлена с помощью нескольких систем искусственного интеллекта.
Автор-составитель: Василий Терлецкий