ݺߣ

ݺߣShare a Scribd company logo
Сервисы
инфраструктуры
данных для
исследователей
Иван Бегтин
UK Data Service
UK Data Service (www.ukdataservice.ac.uk)
Задача
История
Предоставление доступа
исследователей, центральных
и местных властей, бизнеса и
НКО к данным.
Основано в 2012 году при
научном совете по экономике
и соц. исследованиям (ESRC)
Примеры данных
• Перепись населения
• Финансируемые государством
опросы населения
• Исследования с географической
привязкой (опросы домохозяйств)
• Кросс-национальные опросы
• Международные микроданные,
например, от Всемирного Банка
Цель
Развитие научных исследований в экономике и социальных науках
UK Data Service. Управление доступом
• Режим доступа к данным без ограничений
• Применяется когда полностью отсутствует риск
раскрытия персональных данных
Open Data
• Данные позволяющие идентифицировать человека
при связке, например, с частными базами
• Требует регистрации и авторизации
Safeguarded
• Данные позволяющие идентифицировать человека
• Требует особой виртуальной или физической
среды
Controlled
UK Data Service. Ограниченные режимы доступа
Safeguarded (защищённый)
• Данные позволяющие идентифицировать человека при
связке, например, с частными базами
• Могут быть ограничения на коммерческое использование
• Могут требоваться дополнительные соглашения
• Требуют идентификации и авторизации
Controlled (Контролируемый)
• Персональные или иные крайне чувствительные данные
• Специальная защищённая инфраструктура
• Обязательное прохождение обучения
• Обязательное соглашение и предупреждение об
ответственности
UK Data Service. Важные особенности
- Access Secure Lab – лаборатория ограниченного доступа
с физическими местами для доступа к данным.
- Взимание платы с коммерческих проектов – по 450 евро
за каждый проект
- Исследовательский центр – проводят множество
исследований по накопленным данным. Исследования
финансируются ESRC
- Каталог данных – более 7800 наборов данных онлайн с
DOI и цитированием для каждого набора
Australian
National Data
Service
Australian National Data Service (www.ands.org.au)
Задача
История
Предоставление спектра
сервисов вокруг данных и
самих данных для учёных
Основано в 2008 году при
Университете Монаша, в 2018
году вошло в ARDC
Примеры сервисов
• Каталог данных (RDA)
• Цитирование данных (DOI)
• Идентификация данных
• Разработка руководств по работе с
чувствительными данными
• Тренинги по FAIR (гайд по
доступности данных)
Цель
Повышение полезности научных данных для учёных и нации
Australian National Data Service. Важные особенности
- Госфинансирование – финансируются из проекта
National Collaborative Research Infrastructure Strategy
(NCRIS).
- Платный доступ для университетов – доступ к данным
для университетов через Australian Access Federation,
единая академическая система авторизации. Стоимость
подключения $9 617 и годовая подписка $12 840, а также
$5.58 за каждого сотрудника в год.
Australian
Research Data
Commons
Australian Research Data Commons (ardc.edu.au)
Задача
История
Развитие инфраструктуры
научных данных и цифровых
платформ для
исследователей
Основано в 2018 году на базе
ANDS, NECTAR и RDS
Бюджет
• На 2019-2023 годы $110 000 000
(около $22 000 000 в год)
• Из них капитальные инвестиции
$72 000 000
Цель
Создание единой научной инфраструктуры
Australian Research Data Commons. Важные особенности
- Интеграция ANDS – включает в себя инфраструктуру
ANDS и принципы её работы
-
- Госфинансирование – инициатива федерального
правительства и прямая господдержка
- Виртуальные лаборатории – на основе NECTAR Cloud,
инфраструктуры для учёных для дистанционного доступа
к данным
Swedish
National
Data
Service
Swedish National Data Service (snd.gu.se)
Задача
История
Хранение и обмен
информацией научных
исследований
Основано в 2008 году
консорциумом универистетов
Примеры сервисов
• Каталог данных (RDA)
• Обучение
Цель
Создание национальной инфраструктуры открытого доступа
Другие инициативы
- US National Data Service – участвует только университет
Иллинойса, не развивается
- National Data Infrastructure Framework (Канада) – пока на
уровне ежегодных конференций под эгидой Research
Data Canada
Резюме
- практически все существующие инициативы находятся
на госфинансировании прямом или через подписку
университетов/исследовательских центров (ARDC, ANDS,
UK DS)
- инициативы переходят в создание инфраструктуры для
научной деятельности (ARDC)
- большая часть инициатив учреждены государством или
консорциумами университетов (UK DS, ANDS, ARDC)
- практически всегда есть требования по передаче
исследований в централизованный репозиторий
Инструменты
- DataIku – http://dataiku.com
- JupiterHub – http://Jupiter.org
- CKAN – http://ckan.org
- Harvard Dataverse – http://dataverse.org
- Zenodo – http://zenodo.org
Вопросы?
Иван Бегтин, ibegtin@infoculture.ru
Председатель Ассоциации участников рынка данных
Директор АНО “Информационная культура”

More Related Content

Сервисы инфраструктуры данных для исследователей

  • 3. UK Data Service (www.ukdataservice.ac.uk) Задача История Предоставление доступа исследователей, центральных и местных властей, бизнеса и НКО к данным. Основано в 2012 году при научном совете по экономике и соц. исследованиям (ESRC) Примеры данных • Перепись населения • Финансируемые государством опросы населения • Исследования с географической привязкой (опросы домохозяйств) • Кросс-национальные опросы • Международные микроданные, например, от Всемирного Банка Цель Развитие научных исследований в экономике и социальных науках
  • 4. UK Data Service. Управление доступом • Режим доступа к данным без ограничений • Применяется когда полностью отсутствует риск раскрытия персональных данных Open Data • Данные позволяющие идентифицировать человека при связке, например, с частными базами • Требует регистрации и авторизации Safeguarded • Данные позволяющие идентифицировать человека • Требует особой виртуальной или физической среды Controlled
  • 5. UK Data Service. Ограниченные режимы доступа Safeguarded (защищённый) • Данные позволяющие идентифицировать человека при связке, например, с частными базами • Могут быть ограничения на коммерческое использование • Могут требоваться дополнительные соглашения • Требуют идентификации и авторизации Controlled (Контролируемый) • Персональные или иные крайне чувствительные данные • Специальная защищённая инфраструктура • Обязательное прохождение обучения • Обязательное соглашение и предупреждение об ответственности
  • 6. UK Data Service. Важные особенности - Access Secure Lab – лаборатория ограниченного доступа с физическими местами для доступа к данным. - Взимание платы с коммерческих проектов – по 450 евро за каждый проект - Исследовательский центр – проводят множество исследований по накопленным данным. Исследования финансируются ESRC - Каталог данных – более 7800 наборов данных онлайн с DOI и цитированием для каждого набора
  • 8. Australian National Data Service (www.ands.org.au) Задача История Предоставление спектра сервисов вокруг данных и самих данных для учёных Основано в 2008 году при Университете Монаша, в 2018 году вошло в ARDC Примеры сервисов • Каталог данных (RDA) • Цитирование данных (DOI) • Идентификация данных • Разработка руководств по работе с чувствительными данными • Тренинги по FAIR (гайд по доступности данных) Цель Повышение полезности научных данных для учёных и нации
  • 9. Australian National Data Service. Важные особенности - Госфинансирование – финансируются из проекта National Collaborative Research Infrastructure Strategy (NCRIS). - Платный доступ для университетов – доступ к данным для университетов через Australian Access Federation, единая академическая система авторизации. Стоимость подключения $9 617 и годовая подписка $12 840, а также $5.58 за каждого сотрудника в год.
  • 11. Australian Research Data Commons (ardc.edu.au) Задача История Развитие инфраструктуры научных данных и цифровых платформ для исследователей Основано в 2018 году на базе ANDS, NECTAR и RDS Бюджет • На 2019-2023 годы $110 000 000 (около $22 000 000 в год) • Из них капитальные инвестиции $72 000 000 Цель Создание единой научной инфраструктуры
  • 12. Australian Research Data Commons. Важные особенности - Интеграция ANDS – включает в себя инфраструктуру ANDS и принципы её работы - - Госфинансирование – инициатива федерального правительства и прямая господдержка - Виртуальные лаборатории – на основе NECTAR Cloud, инфраструктуры для учёных для дистанционного доступа к данным
  • 14. Swedish National Data Service (snd.gu.se) Задача История Хранение и обмен информацией научных исследований Основано в 2008 году консорциумом универистетов Примеры сервисов • Каталог данных (RDA) • Обучение Цель Создание национальной инфраструктуры открытого доступа
  • 15. Другие инициативы - US National Data Service – участвует только университет Иллинойса, не развивается - National Data Infrastructure Framework (Канада) – пока на уровне ежегодных конференций под эгидой Research Data Canada
  • 16. Резюме - практически все существующие инициативы находятся на госфинансировании прямом или через подписку университетов/исследовательских центров (ARDC, ANDS, UK DS) - инициативы переходят в создание инфраструктуры для научной деятельности (ARDC) - большая часть инициатив учреждены государством или консорциумами университетов (UK DS, ANDS, ARDC) - практически всегда есть требования по передаче исследований в централизованный репозиторий
  • 17. Инструменты - DataIku – http://dataiku.com - JupiterHub – http://Jupiter.org - CKAN – http://ckan.org - Harvard Dataverse – http://dataverse.org - Zenodo – http://zenodo.org
  • 18. Вопросы? Иван Бегтин, ibegtin@infoculture.ru Председатель Ассоциации участников рынка данных Директор АНО “Информационная культура”