Зачем это нужно
Оцифровать источники о Сибири, чтобы каждый мог найти информацию о месте, где живет, происходивших событиях, и самое важное — о своих родственниках. Чем качественнее оцифрованы источники, тем лучше они индексируются поисковыми инструментами. Массив сибирских газет с 1857 до 2000 годов огромен и без помощи волонтеров нам не обойтись. Инструментов машинного распознавания, которые существуют, недостаточно: в газетах разных лет особая верстка и большое разнообразие шрифтов, которые машина может не увидеть.
Что нужно делать
Корректировать автоматическое распознавание текстов из старых сибирских газет на платформе «PRO Сибирь». Инструкцию по работе с платформой можно найти по ссылке.
Как стать участником
Зарегистрироваться на портале https://prosiberia.tsu.ru с помощью аккаунта Google, FB, VK или почты. Перейти в профиль и нажать кнопку «стать волонтером». Затем выполнить тестовое задание и приступить к оцифровке.
Для всех волонтеров проекта сотрудники Научной библиотеки Томского государственного университета с удовольствием проведут виртуальную экскурсию по Музею книги, выставочным пространствам и самой библиотеке. Также бесплатно предоставляются читательские билеты с онлайн-доступом к услугам и ресурсам библиотеки.
Зарегистрироваться на портале https://prosiberia.tsu.ru с помощью аккаунта Google, FB, VK или почты. Перейти в профиль и нажать «стать волонтером». Затем выполнить тестовое задание и приступить к оцифровке.
На экране слева высветится газета, а справа — текст, уже распознанный машиной. Вам предстоит поочередно расшифровывать колонки с записями в газетах и перепечатывать текст в распознанную часть.
Обратите внимание, что после выполнения демо-задания, следующее назначается администратором. Для того, чтобы это произошло, вступите в чат в Telegram или свяжитесь с организатором проекта. Далее вы будете получать задания автоматически и сможете работать в удобном для вас темпе. Также существует рейтинг волонтеров.
Все возникающие вопросы мы обсуждаем в чате в Telegram: https://t.me/prosiberia, смело пишите!
Ознакомиться с инструкцией по работе с платформой можно по ссылке: https://drive.google.com/file/d/11viFhmAfKyMM0vf8Iu43P2EPeR49COHl/view?usp=sharing
«О проекте» словами его авторов
Рассказывает технический менеджер проекта Андрей Пархоменко.
— Доступ к историческим источникам, материалам и архивам сейчас достаточно трудоемок. Нужно заказывать литературу, приезжать, например, в библиотеку и читать все на месте. Это усложняет, замедляет работу исследователя и человека, интересующегося историей своего края и своей семьи. А если оцифрованные источники и есть, то их нужно искать по разным электронным библиотекам и не всегда удобным сайтам.
Мы собираем все источники о Сибири в одном цифровом месте и организуем удобный доступ к ним. Платформа «PRO Сибирь» сегодня — это пространство для многофункционального доступа к периодическим изданиям, рукописям, книжным памятникам, архивам ученых и другим ресурсам, чтобы работать с материалами, которые отражают территориальное, экономическое и культурно-историческое значение Сибири. Все цифровые ресурсы взяты из фондов Научной библиотеки ТГУ и Томского областного краеведческого музея.
Работа по оцифровке архивов продолжается постоянно, важно чтобы каждый источник был еще и распознан. Мы хотим, чтобы каждый пользователь Интернета мог найти информацию о месте, где живет, о происходивших событиях, и самое важное — о своих родственниках. Чем качественнее распознаны источники, тем лучше они индексируются поисковыми инструментами. Массив сибирских газет с 1857 до 2000 годов огромен, и без помощи волонтеров нам не обойтись. Инструментов машинного распознавания, которые существуют, недостаточно: в газетах разных лет особая верстка и большое разнообразие шрифтов, которые машина не видит. Мы приглашаем всех, кому интересно читать и распознавать газеты Сибири, стать частью проекта!
Полезная особенность платформы «PRO Сибирь» — это дополнительные исследовательские возможности. Например, редактирование исходных текстов: входите, читаете статью или книгу и редактируете ее. А также — добавление комментариев непосредственно в тексте источника. Это будет сохраняться только в личном кабинете, но при желании ими можно поделиться. Каждый — и ученый, и обычный человек — может создать свою собственную коллекцию источников, обсуждать и пополнять её.
Цифровая платформа «PRO Сибирь» — это современная площадка, которая совмещает в себе базу научных материалов о Сибири, место для удобной работы с ними и пространство для взаимодействия. Создана Томским государственным университетом на базе Научной библиотеки ТГУ в 2021 году.
Публикации
21.11.2021 В Научной библиотеке ТГУ оцифровали одну из первых университетских газет России28.09.2021 Томичи могут сделать свой вклад в науку, став волонтерами проекта "PRO Сибирь"
25.09.2021 ТГУ выложил в сеть более 100 тыс старых текстовых источников о Сибири
24.09.2021 Как сохраняют книжное наследие (портал Культура, трансляция)
21.09.2021 Публичная презентация платформы «PRO Сибирь»: приглашаем смотреть онлайн-трансляцию
16.09.2021 Томичам расскажут, как платформа «PRO Сибирь» поможет им внести вклад в науку
07.07.2021 Мишустин одобрил платформу «PRO Сибирь» по оцифровке книжного наследия
06.07.2021 Мишустин поручил начать оцифровку книг библиотек РФ по образцу НБ ТГУ
27.06.2021 По максимуму: как ТГУ создает базу источников про Сибирь
16.04.2021 В Научной библиотеке ТГУ запустили новую платформу «PRO Сибирь»
Проект «Люди науки» — Победитель Международной Премии #МыВместе
Представьте, что вы историк или антрополог, или просто интересуетесь местом, где живете, или ищете информацию о родственниках. Сейчас доступ к историческим источникам, материалам и архивам в основном достаточно трудоемок. Нужно заказывать литературу, приезжать, например, в библиотеку, и читать все на месте. Это усложняет и замедляет работу исследователя.
В 2021 году сотрудники Научной библиотеки Томского государственного университета (ТГУ) организовали проект по сбору письменных материалов о Сибири. Так появилась платформа «PRO Сибирь» — все документы в одном цифровом месте.
В самом начале в распоряжении ученых было 200 тысяч выпусков сибирских газет, 2660 названий книг, 580 рукописей, 275 изоматериалов и 1675 тетрадей из экспедиций филологов — все это было необходимо разместить на портале. Количество источников постоянно пополнялось за счет новых оцифрованных документов и на помощь пришли волонтеры: люди науки приняли участие в проекте «Сибирские газеты». От участников требовались умение работать с Excel-таблицами, доступ в Интернет, время и желание.
«До этого мы не имели опыта привлечения волонтеров к научной деятельности, — рассказывает куратор проекта, Андрей Пархоменко, в интервью для издания «Такие дела». — Сегодня к нам приходят и школьники, и студенты, и работающие люди. Их всех объединяет интерес к старинным источникам и желание помочь нам».
Также Андрей отметил, что создателей «PRO Сибирь» вдохновлял пример национальной библиотеки Австралии Trove. Там волонтеры распознали и внесли в базу десятки тысяч документов.
Сейчас проект «Сибирские газеты» завершен, но совсем недавно он получил продолжение. Теперь, когда основные материалы размещены на платформе, ученым нужна помощь в оцифровке архива газет с 1857 до 2000 годов. «Полтора века сибирских газет» — новый проект на портале «Люди науки». У платформы «PRO Сибирь» появился новый функционал — автоматическое распознавание текстов. Однако в газетах разных лет особая верстка и большое разнообразие шрифтов, которые машина может не увидеть, поэтому нужна помощь волонтеров.
Все довольно просто: на экране слева высвечивается газета, а справа — текст, уже распознанный машиной. Задача волонтера — поочередно расшифровывать колонки с записями в газетах и перепечатывать текст в распознанную часть. В описании проекта можно найти инструкцию по работе с платформой.
Чем качественнее оцифрованы источники, тем лучше они индексируются поисковыми инструментами. Поможем оцифровать источники о Сибири, люди науки? Пусть каждый сможет найти информацию о месте, где живет, происходивших событиях, и самое важное — о своих родственниках.