3. Данные повсюду – если
обращать внимание, и это
не только статистика
Новости: вы доверяете
мнениям или данным?
Но! Данные тоже субъективны - собраны людьми
http://www.dear-data.com/all
4. Журналистские
расследования:
Великобритания, скандал
2009 о расходах депутатов
(MP’s expenses scandal)
1. Сотрудник рассказал газетам
о произволе депутатов
2. Журналисты отправили FOI-
запросы в правительство
3. Правительство опубликовало
данные и открыло коммиссию по
контролю бюджета депутатов
(IPSA)
4. Необходимость улучшить
интерфейс доступа к данным
7. Разоблачения и утечка информации
(whistleblowing and leaks): жертвы ради правды
Wikileaks, Джулиан Ассанж, Челси
Мэннинг - фильм “Пятая власть”
NSA Leaks, Эдвард Сноуден, Лаура
Поитрас, фильм “Citizenfour: Правда
Сноудена”
Swiss Leaks (банк HSBC), Эрве
Фальчани, Мар Кабра, Джеймс Бол
Luxembourg Leaks, уход от налогов
Хакер Ассанж в 1995
8. Открытые данные в Великобритании
1. 2000 Акт о свободе доступа к информации (Freedom of Information Act) -> FOI-запрос в гос
органы
2. 2000-ые - данные доступны платно, e.g. Companies House (данные о компаниях)
3. 2006 Кампания the Guardian “Освободите наши данные” (Free our data)
4. 2010 Под давлением открыт правительственный сайт открытых данных (data.gov.uk/ons.gov.uk)
9. Для сравнения: Белстату не помешает
1. Регулярное обновление данных, 2. Сырые данные, а не только сводки, 3. Машиночитаемые
форматы (csv, json), 4. ? бесплатный свободный доступ к информации для всех граждан
10. Где искать данные: 10 идей для Беларуси
1. Задайтесь вопросом “кто собирает информацию” и обратитесь к менеджеру среднего
звена за советом (в идеале как студент или ученый, а не журналаст)
2. Международные порталы открытых данных (небольшой список здесь) и белорусский
портал открытых данных (группа энтузиастов сделает и на заказ)
3. Запросы FOI в Европейские госорганы - например, о связях с Беларусью
4. Исследовательские институты, контакты с учеными
5. Запрятанные данные: финансовые отчеты компаний для инфесторов
6. Профессиональные соц. опросы, crowdsourcing информации (Google Forms)
7. Scraping и API (например, Twitter)
8. Google advanced search на нескольких языках
9. Собрать данные усилиями своей команды
10. Сотрудничество с крупными расследовательскими организациями, например,
Organised Crime and Corruption Reporting Project (специализируется на Восточной Европе),
агентство Jplusplus, International Consortium of Investigative Journalism...
19. В Британских изданиях
90% быстрые истории
● Новости о свежих выпусках
статистики
● Опросы
● Сыежие научные исследования
● Курирование данных на тему
(“Пять вещей вы не знали о…”
● Эксклюзивные находки в
опубликованной статистике
● Локальные истории, найденные в
крупных датасетах
● Опровержения
10% крупные проекты
● Расследования
● Кастомные визуализации (d3.js или
статика)
● Моделирование данных
● Новостные приложения
● Интерактивные лонг-риды
24. Как врать с помощью статистики… more crazy examples
25. Skillset of the ultimate data journalist
● Proficiency using one or more programming languages, such as Python, R or SQL – for
data scraping, parsing and analysis
● Statistical methods (advanced Excel, R)
● Data visualization design (Adobe Illustrator, Photoshop)
● Front-end web development (D3.js, HTML5, CSS3, Javascript, GIS)
team work
Skillset of a data-driven journalist
● Advanced search, open data portals, FOI
● Finding stories in data (Excel)
● Interactive visualisation tools (charting tools like DataWrapper, HighCharts, qz
Chartbuilder; mapping tools like CartoDB; visual analytics like Tableau; other UI-based
digital tools like Knightlab Juxtapose)
26. Сообщество
Mailing lists: Nicar-l, Data-driven-journalism, School of data; get
developer friends.
Teach yourself (tutorials online like Code Academy, Khan Academy,
MOOCs like Learno), google your errors, specialise in what you’re good
at.
Find me: @kr