17 апреля на конференции «Гуманитарные проблемы актуальных наук» проводим секцию вместе с коллегами-исследователями с программы ПАНДАН Европейского университета. Сейчас они занимаются изучением и сохранением цифрового наследия сайтов хостинга Narod.ru.
10:30–12:00
панельная дискуссия
(Не) сохранить интернет. Зачем нам цифровое наследие?
Поговорим о том, как, зачем и от чего нужно спасать разные данные и что будет с тем цифровым наследием, которое удалось сохранить
Участники дискуссии: Иван Бегтин, Иван Бибилов, Анна Козлова, Полина Колозариди, Леонид Юлдашев
12:10–12:35
доклад
Исследовательский потенциал датасета на основе страниц сервисе Narod.ru: погружение вглубь сайтов
Как создавался парсер для сбора данных с сайтов хостинга Narod.ru, который позволяет абстрактно судить о величине сайта по количеству документов, расскажет студентка ПАНДАНа и ведущий советник аппарата Счетной палаты РФ Александра Горваль
12:35–13:00
доклад
Исследовательский потенциал и способы определения языков страниц на сервисе Narod.ru
Студентка программы ПАНДАН и стажер-исследователь Института демографии им.А.Г. Вишневского НИУ ВШЭ Татьяна Максимова расскажет об анализе данных с помощью Polyglot и NLTK и о разработке подхода к определению языка на многоязычных сайтах
14:00–15:00
воркшоп
BeautifulSoup и Selenium: рецепт «вкусного» «народного» парсинга
Попробуем создать парсер с помощью языка программирования Python и библиотек BeautifulSoup и Selenium вместе со студентом ПАНДАНа и преподавателем курса по Введению в Python НИУ ВШЭ Ильясом Аслановым
15:10–16:10
фишбоул-дискуссия
Что делать с Narod’ом?
Поразмышляем о том, какие еще шаги можно предпринять, чтобы сохранить цифровое наследие хостинга Narod.ru и других похожих феноменов. Поговорим о том, какие вопросы этики затрагивает работа с сайтами-дневниками, что делать с утратами на сайтах и какой художественный формат можно применить к подобному материалу
Подробности о конференции и регистрация — по ссылке.
>>Click here to continue<<