59
Модуль 2: От фактического материала к репортажу 1 От фактического материала к репортажу: размышляя, как дата-журналист Модуль 2: От фактического материала к репортажу УЧЕБНОЕ ПОСОБИЕ ДЛЯ СТУДЕНТОВ Этот модуль прививает базовые знания о форматах данных, об умении найти в интернете сведения и концепцию для преобразования данных в репортаж. Начиная с обзора форматов данных, к методам поиска информации в Google. Здесь будет представлена информация о том, как найти различные типы данных, как упорядочить их и как оценить гипотезу. Студентам предоставится возможность преобразовать исходные данные в репортажи. После завершения этого модуля, вы сможете: Идентифицировать базовые форматы данных Находить данные различных форматов Автоматизировать поиски данных Трансформировать данные в простые репортажи Придумывать гипотезы и задавать вопросы Поупражняться в оценке гипотез на примере других репортажей Содержание Начало Урок 1: Распространенные форматы данных Форматы данных: Машиночитаемые, генерируемые компьютером, структурированные Форматы портативных документов (PDF) От форматов документов к машиночитаемым форматам данных Урок 2: Поиск данных онлайн Использование расширенного поиска Настройка оповещений

Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

  • Upload
    others

  • View
    14

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 1

От фактического материала к репортажу: размышляя, как дата-журналист

Модуль 2: От фактического материала к репортажу УЧЕБНОЕ ПОСОБИЕ ДЛЯ СТУДЕНТОВ

Этот модуль прививает базовые знания о форматах данных, об умении найти в интернете

сведения и концепцию для преобразования данных в репортаж. Начиная с обзора форматов

данных, к методам поиска информации в Google. Здесь будет представлена информация о том,

как найти различные типы данных, как упорядочить их и как оценить гипотезу. Студентам

предоставится возможность преобразовать исходные данные в репортажи. После завершения

этого модуля, вы сможете:

● Идентифицировать базовые форматы данных

● Находить данные различных форматов

● Автоматизировать поиски данных

● Трансформировать данные в простые репортажи

● Придумывать гипотезы и задавать вопросы

● Поупражняться в оценке гипотез на примере других репортажей

Содержание

Начало

Урок 1: Распространенные форматы данных

Форматы данных: Машиночитаемые, генерируемые компьютером, структурированные

Форматы портативных документов (PDF)

От форматов документов к машиночитаемым форматам данных

Урок 2: Поиск данных онлайн

Использование расширенного поиска

Настройка оповещений

Page 2: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 2

От фактического материала к репортажу: размышляя, как дата-журналист

Расширенный поиск Google: Охота за предметами!

Использование порталов данных

Национальные базы данных

Навигация по национальным базам данных

Упражнение: Навигация по национальным базам данных

Международные базы данных

Навигация по международным базам данных

Запрос официальных данных

Урок 3: Альтернативные источники данных

Данные Краудсорсинга

Вклад СМИ

Датчики

Дроны

Интеллектуальный анализ данных новостей

Риски

Урок 4: Планирование дата-репортажа

Предпосылки

Гипотезы и вопросы

Построение гипотезы на основе данных и журналистских расследованиях

Вопросы

Урок 5: Обогащение материала данными

Обогащение материала данными: Медицинские отчеты

Обогащение материала данными: Финансовые отчетности

Обогащение материала данными: Сообщения о конфликтах

Обогащение репортажа данными: Сообщения о помощи

Обогащение репортажа данными: Экономическая отчетность

Практика: Поиск данных для тем, интересующих общество

Сценарий

Упражнение: Анализ таблиц фактов

Page 3: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 3

От фактического материала к репортажу: размышляя, как дата-журналист

Обзор

Подоплека

Гипотезы

Подготовка истории

Оценка истории

Начало

Page 4: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 4

От фактического материала к репортажу: размышляя, как дата-журналист

Публичные базы данных, такие как База данных Всемирного банка, содержат больше

информации, чем мы можем себе представить: http://databank.worldbank.org/

Но, согласитесь, большое количество специфической лексики может ввести в заблуждение

непосвящённого пользователя. Вот хотя бы первые несколько категорий. Что означают рост ВВП

(годовой %); ВВП (текущий US$); ВВП на душу населения (текущий US$); ВНД на душу населения,

метод атласа (текущий US$); и экспорт товаров и услуг (% ВВП)? Ведь не каждый, использующий

экономические данные в своих репортажах, должен быть экономистом.

Этот раздел должен помочь вам начать разбираться в комплексах данных. Вы сможете не только

находить основные форматы данных и формулировать вопросы, которые мы, как журналисты,

всегда должны задавать, но и находить ресурсы, призванные помочь нам понять эти данные.

Page 5: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 5

От фактического материала к репортажу: размышляя, как дата-журналист

Урок 1: Распространенные форматы данных

Современный анализ данных происходит с помощью программного обеспечения, которое было

создано, чтобы делать всю тяжелую работу за нас. Мы не можем работать с данными, пока не

превратим их в формат, понятный компьютеру. Данные нужно упорядочить, придать им вид

строк, столбцов и ячеек.

Чаще всего обычные люди не пользуются данными, специально или случайно, именно потому, что

они предоставлены в формате, который не может быть немедленно использован на компьютере.

Этот урок объясняет, какие существуют форматы данных и процессы их трансформации.

Анализ, повествование и визуализация - все зависит от того, сможет ли компьютерная программа

прочитать наши данные. К сожалению, часто данные предоставляются в форматах, которые не

подходят для обработки на компьютере.

Page 6: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 6

От фактического материала к репортажу: размышляя, как дата-журналист

Форматы данных: Машиночитаемые, генерируемые компьютером,

структурированные

В этих форматах данных, компьютерное программное обеспечение распознает эксплицитные

структуры данных. Чаще всего эти данные предоставляются в виде столбцов и строк, которые

организовывают и структурируют отдельные элементы данных. Чаще всего используются

форматы Excel и CSV. Что же значат эти форматы?

● Excel файлы (XLS): данные сохраняются в таблицах Microsoft Excel

● Значения, разделенные запятыми (CSV): Текстовый файл, где каждая новая запись

разделена запятыми

Эти форматы, как правило, лучше подходят для анализа, и вы можете легко работать с ними,

например, в Excel. При поиске данных, если вам удалось найти данные в формате Excel или CSV,

это хороший знак. Значит вам не придется тратить много времени на их очистку и

форматирование.

Стоит учитывать, что форматы CSV (значения, разделенные запятыми) и TSV (значения,

разделенные табуляцией) используются для «кодирования» табличных данных. Проще говоря,

файлы CSV и TSV содержат текст, в котором:

● Каждая линия, это отдельная строка и

Page 7: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 7

От фактического материала к репортажу: размышляя, как дата-журналист

● В каждой линии колонки разделены запятыми (в CSV) или табуляцией (а TSV)

Файлы Excel также использует аналогичную структуру, но опираются на программное обеспечение

Microsoft.

Инструменты:

Для работы с этими форматами стоит использовать доступные инструменты, среди которых

электронная таблица Google и Microsoft Excel.

Page 8: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 8

От фактического материала к репортажу: размышляя, как дата-журналист

Портативный Формат Документа (PDF)

PDF файлы бывают нескольких различных видов.

Первый вопрос, они созданы компьютером или нет? То есть, был ли файл сохранен в

формате PDF, либо, он изначально распечатывался, сканировался, и превращался в

изображение с помощью программного обеспечения.

Второй вопрос- данные в файле pdf структурированы? Они доступны в столбцах и строках,

упорядоченных в таблице.

Наконец, если это поиск – был ли он создан с помощью компьютера. В основном поиск

означает, что вы можете выделить текст и компьютер распознает буквы и цифры как

символы.

Page 9: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 9

От фактического материала к репортажу: размышляя, как дата-журналист

Из PDF в машиночитаемые форматы данных

Как правило, лучше всего подходят форматы данных для анализа CSV или Excel, так как они

структурированные и машиносчитываемые. Когда вы находите данные в других форматах, скажем

в PDF, необходимо преобразовать их в структурированный и машиночитаемый формат.

Данные в PDF

Файлы PDF часто содержат структурированные, компьютерные таблицы, но PDF-файл не является

форматом данных. Таблица должны быть преобразован в формат, который можно открыть с

помощью программы обработки электронных таблиц. Так, как эти таблицы данных, требуется

извлечение в формат данных с помощью специального программного обеспечения. Вы будете

практиковать извлечение данных в программе Scraping lab.

Инструменты: Tabula, CometDoc, PDFtoExcel, Zamzar

Данные в отсканированных изображениях

Прежде всего, это графические файлы, которые читаются как один гигантский блок, а не

отдельные части. Они требуют установки программы оптического распознавания. Как правило,

они используются для файлов, которые были сгенерированы компьютером, распечатаны, а потом

отсканированы назад. Таким образом файл превратился в гигантское изображение.

Page 10: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 10

От фактического материала к репортажу: размышляя, как дата-журналист

Примеры: Некоторые PDF и все bitmap изображения (GIF, JPEG, PNG, BMP)

Инструменты: Google Docs OCR, Document Cloud

Данные в неструктурированных форматах

Некоторые данные были сгенерированы на компьютере, но не имеют структуры, распознаваемой

компьютером. Это могут быть данные, введенные в текстовом документе в формат абзацев, и

некоторые данные на веб-сайтах. В принципе, в этом случае Разработчик должен научить

компьютер, как извлечь данные в необходимый для него формат.

Инструменты: Python или Ruby языки программирования для сбора данных, используя

https://morph.io/

Менее распространенные форматы данных

Некоторые данные, особенно в больших базах, сохраняются пакетами, которые могут быть

преобразованы в веб-сайты. Чаще всего они требуют преобразования в CSV или Excel для

дальнейшего использования с программным обеспечением электронных таблиц.

Примеры: JSON (JavaScript Object Notation) или XML (расширяемый Язык разметки) для

программирования и .SAV или .R. Попробуйте использовать https://konklone.io/json/, чтобы

переконвертировать файл JSON в to CSV.

Page 11: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 11

От фактического материала к репортажу: размышляя, как дата-журналист

Урок 2: Поиск данных онлайн1

В век цифровых технологий, стали доступны гораздо большие объемы данных, чем когда-либо

прежде. Иногда кажется, что мы тонем в данных. И трудно найти то, что мы на самом деле ищем.

В этом уроке мы изучим способы поиска данных в интернете. Это можно делать через порталы

или с помощью поиска. Мы также рассмотрим варианты, когда нужные нам данные недоступны,

и приходится их собирать при помощи "краудсорсинга" или датчиков.

1 Схема создана Полом Брэдшоу. В ней показаны распространенные способы, с помощью которых

журналисты пытаются получить доступ к данным и что они делают, когда сталкиваются с

препятствиями. Если во время своего поиска, вы упретесь в стену, и не будете знать, что делать

дальше, то вам поможет эта ссылка: http://onlinejournalismblog.com/2011/09/06/gathering-data-a-

flow-chart-for-data-journalists-2/

Page 12: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 12

От фактического материала к репортажу: размышляя, как дата-журналист

Использование Расширенного Поиска

Существует множество источников данных в интернете. Удобный способ найти данные в

интернете, это использовать Расширенный поиск Google.

GOOGLE РАСШИРЕННЫЙ ПОИСК

Откройте http://www.google.com/advanced_search

Появится окно с несколькими полями поиска. В следующей таблице описаны различные варианты

Расширенного поиска Google. Также тут предоставлены альтернативные варианты быстрого ввода,

которые можно использовать в стандартном поиске Google. С ними вы, возможно, уже знакомы.

Page 13: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 13

От фактического материала к репортажу: размышляя, как дата-журналист

Элементы расширенного поиска в Google Альтернативные варианты в обычном поиске

Все слова – как в обычном поиске Google Введите все слова, которые вы хотите найти в

обычной строке поиска

Точное слово или фраза - помогает найти

результаты, в которых слова отображаются

именно в том порядке, в котором вы их

указали

Используйте кавычки, например, “Министерство

труда и развития человеческих ресурсов”

Любое из этих слов - помогает найти

результаты, в которых встречается любое из

введенных слов

Используйте ИЛИ между словами в поиске –

например, сельское или фермерское или

загородное

Ни одно из этих слов – отфильтрует

результаты поиска так, чтобы там не

встречались указанные вами слова

Введите знак минус перед словом, которое вы

хотите исключить из результатов в выдаче – к

примеру: Черногория -туризм

Язык: укажите язык результатов -

Регион: ограничьте в выдаче результаты

только из определенной географической

области

-

Последнее обновление: ограничьте

результаты недавним контентом

-

Сайт или домен: Сузьте поиск до

конкретного сайта

Используйте этот формат для поиска - site:url

Например: site:http://www.who.int/

Адрес веб-сайта должен быть ТОЧНЫМ.

● ВЕРНО

site: https://www.unodc.org/

● НЕ ВЕРНО

site: WorldHealthOrganization.org

Тип файла: Поиск только файлов с

определенным расширением (например: xls,

pdf, csv, doc)

Используйте этот формат для поиска – Тип

файла:[расширение]

Page 14: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 14

От фактического материала к репортажу: размышляя, как дата-журналист

Вот пример, как найти файлы с расширением XLS:

● ВЕРНО

filetype:xls

● НЕ ВЕРНО

filetype:Excel

Теперь давайте попробуем Расширенный поиск Google:

Используйте «любое из этих слов», чтобы найти материалы о недоедании, голоде и

смерти от голода в вашей стране.

Используйте «ни одно из этих слов», чтобы найти информацию о недоедании, но не о

детях.

Найдите материалы о гриппе только на украинском языке.

Найдите материалы о гриппе только на молдавских веб-сайтах

Найдите материалы о гриппе за последнюю неделю.

Найдите на сайте вашего Министерства здравоохранения файлы формата Excel

Найдите PDF-документы о материнском здоровье в вашей стране.

.

Page 15: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 15

От фактического материала к репортажу: размышляя, как дата-журналист

Настройка Оповещений

Если вы заинтересованы в определенной теме, Вы также можете использовать следующие

методы для получения уведомлений об обновлениях информации онлайн.

Оповещения Google, чтобы вы могли следить за интересующими вас темами

Шаг 1: Войдите в Gmail

Шаг 2: Перейдите на https://www.google.com/alerts

o Или введите http://www.talkwalker.com/alerts

Шаг 3: Создайте оповещение. Будьте конкретными. Укажите тему, область или человека,

представляющего для вас интерес.

Шаг 4: Выберите периодичность, источник, язык, регион и количество уведомлений.

Шаг 5: Включите уведомления и выключите их, когда напишите репортаж.

Отслеживание изменений и нового контента, загруженного на сайты

Шаг 1: Откройте www.changedetection.com/

o Или можете использовать Update Scanner: http://updatescanner.mozdev.org/en/

Шаг 2: Откройте веб-сайт, который регулярно (но не слишком часто) обновляет данные

или материалы

Шаг 3: Скопируйте URL-адрес этого сайта в окно программы обнаружения изменений

Шаг 4: Получайте уведомления, когда новый контент загружается на сайт

Page 16: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 16

От фактического материала к репортажу: размышляя, как дата-журналист

Расширенный Поиск Google: Охота за предметами!

Используйте поиск Google, чтобы найти:

Отчет в формате PDF по образованию в вашей стране

Отчет в формате PDF на веб-сайте ЮНИСЕФ по иммунизации в вашем регионе

Национальный бюджет Вашей страны за 2016 год

Годовой объем экспорта Вашей страны на www.tradingeconomics.com/

Файл Excel с данными о мигрантах из вашей страны

Примерный демографический прогноз с сайта национальной статистики

Уровень инфляции в стране за последние 20 лет

Новости о ВИЧ в Вашей стране за последний месяц

Page 17: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 17

От фактического материала к репортажу: размышляя, как дата-журналист

Использование Порталов с данными

Последнее время большинство стран открыло доступ к данным статистики. Были созданы

специальные дата-порталы. Они являются бесценным источником информации и важно

понимать, как использовать различные интерфейсы этих порталов, чтобы получить нужные

данные.

Международные, государственные, гражданские общества, Университетские базы данных – это

все фантастические источники данных. Однако все они имеют собственные интерфейсы, которые

немного отличаются между собой. Необходимо их исследовать, чтобы понять, как в них

ориентироваться.

Мы предлагаем вам общее руководство, как пользоваться поиском по базам данных:

Page 18: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 18

От фактического материала к репортажу: размышляя, как дата-журналист

Выбор базы данных

Во многих случаях, на веб-сайте будет много баз данных. Важно

выбрать, какую базу данных вы хотите найти. Например, на портале

данных Всемирного банка, среди других вариантов, можно выбрать

для поиска данные только о состоянии здоровья, данные только об

образовании или об индикаторах развития.

Выбор географического

региона

Есть много способов сравнить, насколько ваше географическое

пространство отличается от других. Вы можете сравнивать соседние

города, государства, страны, регионы со сходным уровнем

экономического развития или численность населения.

Выбор показателей

Часто базы данных дают вам возможность ставить галочки, чтобы

определить, какие показатели нужно сравнить. Лучше всего

выбирать широкий ассортимент, искать интересные тенденции, а

позже сужать спектр поиска.

Выбор периода времени

Чем больше промежуток времени, тем выше вероятность найти

достаточно данных для выявления тенденций. Во многих случаях,

данные собирались в разных странах, и в разные года, так что лучше

начать с широкого диапазона, а затем сузить период времени. Ведь

к этому времени вы точно будете знать, что именно вас интересует.

Выбор формата

Часто базы данных представляют из себя таблицы, карты или

визуализацию. Это могут быть полезные инструменты. Ведь вы сами

заинтересованы в загрузке данных в формате CSV или Excel.

Визуализации могут быть полезны для выявления закономерностей,

но в целом, лучше работать с исходными данными самим.

Page 19: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 19

От фактического материала к репортажу: размышляя, как дата-журналист

Национальные Базы Данных

Вот несколько сайтов, откуда можно получить доступ к национальным порталам данных:

● http://unstats.un.org/unsd/methods/inter-natlinks/sd_natstat.asp

● https://www.opendatasoft.com/a-comprehensive-list-of-all-open-data-portals-around-the-

world/

● https://investigativedashboard.org/

Page 20: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 20

От фактического материала к репортажу: размышляя, как дата-журналист

Международные Базы Данных

В дополнение к национальным базам данных, существует множество международных

источников:

Всемирная Организация Здравоохранения

Организации Объединенных Наций

Справочное Бюро Населения

UNICEF Данные

Портал мирового правительства

Каталог общедоступных данных Google

Концентратор данных

DBPedia Массив Данных

Фактические массивы

Page 21: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 21

От фактического материала к репортажу: размышляя, как дата-журналист

Бесплатные ГИС-данные

Список открытых ресурсов с данными

Энергетическое хранилище данных

Всемирный Научно-Исследовательский Институт

Массив данных

Quora тема: "Где я могу найти большие массивы данных в открытом доступе?"

Директория APIs

Infochimps

Datamarket

Оффшорные Утечки

Расследования

Открытые корпоративные данные

Данные по живой природе

UNEP Данные

Индекс уровня коррупции

База Данных Собственности На Землю

Всемирная Организация Gapminder

Глобальная Лаборатория Данных

Page 22: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 22

От фактического материала к репортажу: размышляя, как дата-журналист

Управление Международными Базами Данных

Воспользуйтесь этим примером, чтобы скачать информацию о своей и соседних странах из

международной базы данных:

1. Откройте http://databank.worldbank.org/

2. В графе «ИЗУЧЕНИЕ БАЗ ДАННЫХ», выберите Здоровое питание и статистика

населения. Откроется экран Здорового питания и статистики населения.

3. Выберите «Страну»:

Албания

Армения

Азербайджан

Беларусь

Босния и Герцеговина

Хорватия

Кипр

Грузия

Казахстан

Косово

Кыргызстан

Молдова

Черногория

Румыния

Российская Федерация

Сербия

Таджикистан

Македония

Турция

Туркменистан

Украина

Узбекистан

4. Прокрутите страницу вниз и нажмите «Серия». Данные не указаны.

5. Нажмите иконку Фильтр и выберите Медицинские ресурсы и их применение.

6. Установите флажки на Количестве медсестер и акушерок (на 1000 человек) и

Количестве врачей (на 1000 человек).

7. Теперь нажмите Года. Появится список доступных лет.

Page 23: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 23

От фактического материала к репортажу: размышляя, как дата-журналист

8. Выберите года, которые вас интересуют, скажем, последние 15 лет. Нажмите

Применить изменения.

9. Щелкните на Таблицу в правом верхнем углу, когда закончите выбирать. Вы

всегда сможете нажать на меню справа, чтобы изменить свой выбор.

10. Нажмите кнопку Скачать и загрузите данные в файл Excel.

11. Откройте файл данных в Excel.

Создать запрос на получение Правительственных данных

19 статья Всеобщей Декларации Прав Человека гласит, что каждый имеет право на свободу

убеждений и на свободное их выражение; это право свободно высказывать свое мнение. Право

свободно искать, получать и распространять информацию любыми средствами, независимо от

государственных границ.

Многие страны, открывшие данные, создали законы, регулирующие правила получения данных и

составления информационных запросов. Во многих странах этот закон принят совсем недавно, и

очень важно, чтобы журналисты подавали заявки, следуя ему. Такое поведение должно помочь

создать систему обмена данными между правительством и гражданами.

Чтобы узнать больше о свободе информации, посетите http://foiadvocates.net/

Чтобы просмотреть законы о доступе к информации в вашей стране, посетите:

http://www.freedominfo.org/regions/

Многие из государственных органов по-разному оправдывают отказ, который вы можете получить

на ваш запрос. Помните, это просто отговорки! Вы должны быть конкретными и настойчивыми в

ваших запросах. И только тогда вы сможете получить данные, которые вам нужны.

“У нас нет данных на компьютере”

“Информация платная“

“Отсутствует техническая возможность предоставить информацию“

“Ваш запрос неясен”

“Запрос составлен неверно“

“Наша база данных слишком сложная, чтобы дать вам доступ”

“Наше программное обеспечение является собственностью”

“Эта информация защищена законом о конфиденциальности”

Page 24: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 24

От фактического материала к репортажу: размышляя, как дата-журналист

Урок 3: Альтернативные источники данных

Часто, когда официальные источники данных недоступны, организации могут использовать

“краудсорсинг” для сбора данных от граждан или группой волонтеров. Они также могут

использовать датчики, сообщения граждан, сообщения из средств массовой информации или

утечки данных. Одним словом, альтернативные источники.

Например, взгляните на Карту Насилия во время выборов в Афганистане:

http://www.tfp.nai.org.af/map/main

Наблюдатели в Афганистане отправляли SMS-сообщения о насилии и нарушениях в день выборов.

Места расположения этих избирательных участков наносились на карту. Наблюдатели были

заранее обучены тому, как пользоваться этой системой. Позже эти данные были использованы

журналистами для репортажей о ситуации на избирательных участках по всей стране.

Page 25: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 25

От фактического материала к репортажу: размышляя, как дата-журналист

Данные краудсорсинга

Одной из наиболее известных платформ для сбора «общедоступных» данных является Ushahidi.

Эта платформа была развернута на базе карты природных катастроф, политических кризисов и

других событий. Эта система позволяет открыто или анонимно отправлять сообщения о

происшествиях (например, о насилии, фальсификации на выборах, преследовании со стороны

полиции, и прочем). Данные отправляются в централизованную систему для проверки и

публикуются в базе данных.

Например, веб-сайт Uchaguzi2 использовал Ushahidi для мониторинга выборов в Кении. На их

примере СМИ получили доступ к централизованной сети наблюдателей, которые отслеживали и

классифицировали инциденты на выборах.

2https://www.facebook.com/ushahidi/photos/a.193585313994844.42244.116038145082895/543807175639321/

?type=1&theater

Page 26: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 26

От фактического материала к репортажу: размышляя, как дата-журналист

Вклад СМИ

Во многих случаях средства массовой информации используют свидетельства очевидцев,

полученные через SMS, видео или фотографии – это называется помощь граждан журналистам.

Например, Al Jazeera3 часто пользуются социальным сетям и СМИ, чтобы публиковать

информацию о ситуации в Сирии. Большинство СМИ, как правило, проверяют ситуацию на месте,

но и они не застрахованы от публикации ложного контента.

3 http://www.stream.aljazeera.com/story/201105112039-003652

Page 27: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 27

От фактического материала к репортажу: размышляя, как дата-журналист

Датчики

Данные, полученные с помощью датчиков, используются для получения информации по

экологическим проблемам. Например, СМИ могут с помощью волонтеров распространять

небольшие, недорогие датчики. Они будут собирать данные о качестве воздуха, температуре

воды, или сейсмической активности.

Например, проект Ekuatorial4 - это попытка сбора данных о тропических лесах Индонезии.

Территория удаленная, и ее трудно контролировать. Датчики остались у членов общин в районах,

где сбор данных стандартными средствами затруднен. Они присылают данные об условиях

окружающей среды, которые, в сочетании с национальными и спутниковыми данными,

формируют общую картину деградации окружающей среды.

4 http://ekuatorial.com/en

Page 28: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 28

От фактического материала к репортажу: размышляя, как дата-журналист

Дроны

Все чаще СМИ используют беспилотные летательные аппараты для оценки размера протестов,

измерения размеров свалок, расчётов темпов обезлесения, и для сбора другой полезной

информации с высоты птичьего полета.

Например, Wall Street Journal разместили видеозаписи о масштабах протестов в Гонконге,

сделанные дронами: http://www.wsj.com/video/aerial-drone-captures-scale-of-hong-kong-

protests/76AA792E-7AB9-4D2B-88BB-E9B5F9D707EC.html

Дроны существуют уже очень давно, но ввиду положения о защите частной жизни, в случае с

этими видеозаписями может создаться впечатление, что за протестующими шпионили. Ведь

беспилотник мог быть правительственным, и мог вызвать подозрение.

Page 29: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 29

От фактического материала к репортажу: размышляя, как дата-журналист

Интеллектуальный Анализ Данных

В случаях нехватки официальной информации, краудсорсинг СМИ часто дает богатый

дополнительный объем данных. Эта стратегия была использована для сбора данных о насилии в

отношении женщин, о погибших в перестрелках с полицией, и о помощи Китая Африке.

Например, источник ‘Файлы Мигрантов’5 опубликовал данные о гибели мигрантов в Средиземном

море, взятые из разных мировых СМИ. В сочетании, эти отчеты рисуют гораздо более полную

картину гибели мигрантов на пути в Европу.

5 http://www.themigrantsfiles.com/

Page 30: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 30

От фактического материала к репортажу: размышляя, как дата-журналист

Риски

Краудсорсинг всегда противопоставлялся официальным данным: те, у кого нет доступа к

государственным данным, как правило, также не имеют доступа к телекоммуникациям,

необходимым, чтобы донести свои данные.

Предвзятость выбора: информацию предоставляют только люди с наличием времени,

ресурсов и мотивации.

Процесс верификации: люди могут заносить в систему недостоверные данные и

трудно будет выяснить, какие факты реальные.

Контекст: из общественных источников данных мы узнаем только то, что говорит нам

толпа. В таком случае часто теряется контекстная информация.

Конфиденциальность: иногда раскрываются ваши личные данные, и вы можете стать

мишенью для критики.

Page 31: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 31

От фактического материала к репортажу: размышляя, как дата-журналист

Например, данные в отчетах о перебоях в системе питания в Найроби6, указаны с учетом районов,

в которых доступ к электроэнергии сильно ограничен. Именно поэтому, эти данные сильно

занижены.

6 http://poweralerts.kenyapower.co.ke/tweetmap

Page 32: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 32

От фактического материала к репортажу: размышляя, как дата-журналист

Урок 4: Планирование дата-репортажа

Доступность данных в современном мире повлияла на то, как люди получают информацию.

Теперь вы можете разработать больше идей и решений обогатив данными традиционные

информационные каналы. В этом уроке мы рассмотрим, как журналисты дополняют данные,

чтобы создать успешный репортаж.

Когда солнце садится над Турканой

Взгляните на эту новость: https://www.youtube.com/watch?v=Ga8CEYVALo4

http://www.internewskenya.org/summaries/internews52e7747b74fff.pdf

В данном примере журналист расследует тему: засуха и голод в Туркане, анализируя

определенные данные:

Она рассматривает климатические данные, чтобы определить, увеличивается ли

интенсивность и частота засух.

Page 33: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 33

От фактического материала к репортажу: размышляя, как дата-журналист

Она использует данные о состоянии здоровья, чтобы определить воздействие

недостаточного питания на здоровье детей.

Она использует данные международной помощи, чтобы определить, есть ли решение

проблемы в долгосрочной перспективе: например, есть ли инвестиции в

продовольственную безопасность вместо гуманитарной помощи.

Ключ к успеху для любого дата-журналиста – организация. В отличие от многих других видов

журналистики, от того, как вы решите организовать вашу информацию, и расскажете вашу

историю, может зависеть ее успех. Процесс организации дата-репортажа состоит из шести шагов:

1. Предпосылки

2. Гипотезы и вопросы

3. Анализ

4. Интервью

5. Организация репортажа

6. Визуализация

По мере продвижения, мы рассмотрим задачи и навыки, необходимые для каждого шага. В этом

уроке мы рассмотрим два этапа планирования: «предпосылку» и «гипотезы и вопросы».

Предпосылки

Когда мы изначально находим тему для дата-репортажа, первый шаг - это поиск других

репортажей, подготовленных другими журналистами на эту же тему. Таким образом мы

преследуем несколько целей. Ознакомиться с тем, как другие журналисты подошли к вопросу, где

и как они использовали данные и что сделали, чтобы их репортаж оказался эффективным.

Случаи насилия в отношении женщин: лучший вариант решения медиация?

В этом репортаже команда журналистов решила освещать вопросы бытового насилия в

Афганистане.

Тематические исследования

Используя метод расширенного поиска в Google, они нашли в СМИ три подобных репортажа:

Индия - Страна насилия, Стресс у мужчин, IndiaSpend, Индия

Пока смерть не разлучит нас, Post and Courier, США

Самые опасные транспортные системы для женщин, Global Post, Мировой

Из этих примеров журналисты выделили:

Page 34: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 34

От фактического материала к репортажу: размышляя, как дата-журналист

Способность правительства решать ситуацию является ключевым фактором в

определении того, повторится ли ситуация с жертвами насилия.

Реальные показатели бытового насилия и официальная отчетность значительно

отличаются в разных географических регионах

Визуализации эффективно показывают масштабы проблемы

Отчеты/Данные

На следующем этапе, журналисты находят отчеты и сведения, связанные с предметом

расследования. Эти отчеты могут быть найдены путем поиска, через запросы правительственных

данных, запросы гражданским организациям или путем создания данных для расследования.

Для материала о бытовом насилии, журналисты выделили следующие ключевые отчеты:

Справедливость глазами афганских женщин: случаи насилия в отношениях женщин урегулируются путем медиации и через суд по UNAM?OCHA

Обновленная информация о выполнении Закона о ликвидации насилия в отношении женщин в Афганистане

Афганистан - ликвидация детских браков и насилия в семье

ОСМП доступ женщин к правосудию в Афганистане

Портал Данных Всемирного Банка Полов

Методология

Чтобы оценить данные, журналисты ответили на следующие вопросы (здесь примеры ответов из

первого отчета)

Кто собирал данные?

Миссия ООН по содействию Афганистану

Когда были собраны данные?

Подробная информация из 18 провинций Афганистана, взятая за один год. Период - с октября 2012 по сентябрь 2013 года. Взята из технического обзора Верховного комиссара по правам человека при ООН

Какой временной период данных?

Два года (2012-2013)

Как собирались данные?

Мониторинг и анализ деятельности полиции и судов

Важные выводы

Наконец, журналисты прочли резюме доклада и записали 3-5 интересных находок.

Page 35: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 35

От фактического материала к репортажу: размышляя, как дата-журналист

1. Количество сообщений о бытовом насилии возрастает

2. Экономическая и социальная уязвимость женщин остается без изменений

3. Большинство случаев бытового насилия регистрируются в полиции

4. Большинство случаев бытового насилия решаются путем медиации

Гипотезы и вопросы

Самый важный этап процесса создания дата-репортажа – это формулирование гипотезы и

вопросов. В научных исследованиях, автор развивает гипотезу, высказывая идеи, а затем ставит

эксперимент, чтобы подтвердить гипотезу. То же самое мы можем сказать и о данных. Журналист,

используя свой чутье, развивает гипотезу, которая может быть доказана или опровергнута

данными. Статьи в новостях имеют привычку вызывать больше вопросов, чем ответов. В то время

как гипотеза и расследование раскрывают детали, которые приводят к репортажу дата-

журналистики.

Построение гипотезы для данных и журналистское расследование7

1. Гипотеза дает вам повод проверить информацию, не требуя раскрывать некую

тайну. Люди не выдают своих секретов без веской на то причины. Они охотнее просто

подтвердят информацию, которая уже имеется в вашем распоряжении, поскольку

большинство людей не любят лгать. Гипотеза как раз дает вам возможность попросить

что-то подтвердить, а не раскрывать информацию. Ее наличие также помогает вам

найти что-то новое для своего материала. То, чего вы поначалу не заметили. Ведь

могут открыться новые факты, о которых вы раньше не знали.

2. Гипотеза позволяет легче управлять вашим проектом. Определив то, что вы ищете, и

где начинать искать, вы можете оценить, сколько потребуется времени на

расследование. Но это только первый шаг, и мы вернемся к этому пункту в конце

главы.

3. Гипотеза - это инструмент, который вы можете использовать снова и снова. Когда вы

научитесь работать методично, ваша карьера изменится. Мало того, вы сами

изменитесь. Вам больше не нужен будет кто-то, кто будет указывать, что вам делать.

Вы увидите, что можно сделать для борьбы с хаосом и страданиями в этом мире, и вы

7 http://unesdoc.unesco.org/images/0019/001930/193078e.pdf

Page 36: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 36

От фактического материала к репортажу: размышляя, как дата-журналист

будете в состоянии сделать это. Разве не ради этого в первую очередь вы стали

журналистом?

4. Гипотеза практически гарантирует, что в результате вы подготовите репортаж, а не

просто список данных. Редакторы хотят знать, что, в конце определенного периода

времени и определенного вложения ресурсов, вы выдадите им готовый материал для

публикации. Гипотеза многократно увеличивает вероятность такого исхода. Она

позволяет прогнозировать минимальный и максимальный положительный результат

вашей работы, а также наихудший результат.

Хуже всего, когда проверка гипотезы быстро показывает, что нет никакой

истории, но в таком случае проект может быть завершен без затрат

значительных ресурсов.

Минимальный положительный исход - первоначальная гипотеза верна, и

может быть быстро проверена

Максимум - если эта гипотеза верна, далее следует логическая цепочка, а

также серия репортажей, или один большой репортаж.

Советы для сильной гипотезы:

● Постулирует теорию, которая может быть доказана или опровергнута данными

● Конкретно говорит о том, что можно измерить

● Имеются доступные данные

● Тема важна для общественности

Ниже приведен пример, как превратить слабую гипотезу в сильную:

1. Дети в этой стране умирают от недоедания.

2. Большинство детей в возрасте до пяти лет в этой стране умирают от недоедания.

(Добавить показатель, который можно измерить - “до пяти причин смертности”.)

3. Большинство детей в возрасте до пяти лет в этой стране умирают от недоедания и

живут в беднейших провинциях. (Добавьте географические данные и экономические

показатели)

4. Большинство детей в возрасте до пяти лет в этой стране умирают от недоедания и

живут в беднейших провинциях. И это несмотря на гуманитарную программу и

поддержку спонсоров, которая призвана сократить уровень недоедания в два раза за

пять лет. (Добавить меру, и есть ли решение проблемы)

Page 37: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 37

От фактического материала к репортажу: размышляя, как дата-журналист

Гипотеза

После завершения расследования афганских журналистов, были разработаны следующие

гипотезы:

Государственные программы не могут угнаться за ростом бытового насилия.

Как вы видите, эта гипотеза постулирует две теории, которые могут быть доказаны или

опровергнуты данными:

Внутренние показатели насилия растут;

Государственная реакция на эти сообщения неадекватна;

Пожалуйста, оцените следующие гипотезы, поставив оценку С (сильная) или W (слабая). Если

слабая, пожалуйста, опишите почему.

1. Министерство здравоохранения должно тратить больше средств на

здравоохранение ___

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

Page 38: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 38

От фактического материала к репортажу: размышляя, как дата-журналист

2. Средняя оценка за тестовые задания в начальных классах растет, но жители

сельской местности и малообеспеченные семьи не имеют возможность отправлять своих

детей в школу.____

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

3. Снижение государственных расходов на здравоохранение за последние пять лет

способствовало отсутствию прогресса в достижении Целей В Области Развития,

Сформулированных В Декларации Тысячелетия. ___

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

4. Отсутствие больниц приводит к высокому уровню заболеваний. ____

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

5. Количество детей, в возрасте до 5 лет, уменьшается. ____

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

Вопросы

Если у вас есть сильная гипотеза, вы должны разработать как минимум пять вопросов, на которые

можно ответить на основе данных, чтобы доказать или опровергнуть вашу гипотезу. Все вопросы

должны быть пронумерованы. Другие типы вопросов, например, вопросы для интервью, будут

разработаны после анализа.

Ваши вопросы должны содержать:

● Определение тренда.

● Сравнение различных групп.

● Измерения причин.

● Меры воздействия.

Page 39: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 39

От фактического материала к репортажу: размышляя, как дата-журналист

Вопросы

Вспомните гипотезу локального репортажа о насилии:

Государственные программы не могут угнаться за ростом бытового насилия.

Вот вопросы, которые написали журналисты к этой гипотезе:

1. Количество случаев, ежегодно растет или уменьшается?

2. Какой возраст у тех женщин, которые подверглись насилию в семье? Сколько

среди них молодых женщин?

3. Какой процент женщин подвергаются бытовому насилию в Афганистане?

4. Насколько плоха ситуация для женщин в Афганистане по сравнению с остальным

миром?

5. Какой процент зарегистрированных случаев доведен до суда? Что происходит в

остальных случаях?

6. Какие виды насилия преследуются по новому закону?

7. Какой процент дел в судах заканчивается обвинительными приговорами?

Урок 5: Обогащение материала данными

Множество рассказов, которые содержат сведения и статистические данные не очень подходят

для дата-журналистики данных, потому что они не используют данные, объясняющие проблему.

Одним из наиболее важных навыков в области дата-журналистики является возможность

превратить обычную историю в дата-репортаж. Для каждого репортажа ниже, прочтите

имеющуюся историю и превратите ее в идею для дата-репортажа. В некоторых случаях у

журналиста есть гипотеза, но он не может подкрепить ее данными. В других случаях, есть данные

и статистика, но непонятно, что журналист пытается доказать.

Page 40: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 40

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: происшествия

В этом новостном материале говорится о том, сколько ДТП было зарегистрировано в Кыргызстане

с января по август 2016 года, сколько людей погибло и получило ранения, а также каковы

причины несчастных случаев:

http://ru.sputnik.kg/Kyrgyzstan/20160920/1029301505/kazhdyj-den-na-dorogah-kr-pogibaet-po-dva-

cheloveka.html

Давайте критически подойдем к такому новостному материалу.

Page 41: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 41

От фактического материала к репортажу: размышляя, как дата-журналист

Дает ли он вам полное представление о картине? Больше ли стало погибать людей или меньше? А

детей? Меняются ли наиболее частые причины несчастных случаев?

Как выглядит ситуация в Кыргызстане по сравнению с другими странами региона?

Обратите внимание, что заголовок представляет собой хороший пример объяснения данных для

аудитории - журналист перевел общее число жертв в яркий образ: каждый день на дорогах

страны погибает по два человека. Давайте подумаем, как могла бы выглядеть гипотеза дата-

журналиста, который работает над этим материалом, и какие данные потребуются, чтобы эту

гипотезу проверить.

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Примите во внимание:

● Какие наборы данных потребуются, чтобы проверить гипотезу?

● Какие наборы данных помогут поместить имеющуюся информацию в контекст?

● Кто предоставляет эти данные? Доверяете ли вы источнику данных?

● Существуют ли альтернативные источники данных?

● Какие еще факторы могут влиять на количество ДТП? На количество жертв? На

количество раненых?

● Были ли за последнее время в отрасли проведены какие-либо реформы? Были ли

крупные катастрофы, которые могли повлиять на статистику?

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 42: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 42

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: здравоохранение

Перед вами новостная заметка о доставке вакцин в Украину и распределении по

регионам:http://www.unian.net/society/1497033-ukraina-poluchila-25-milliona-doz-

protivotuberkuleznoy-vaktsinyi-btsj-minzdrav.html

Насколько исчерпывающе представлены данные о доставке и распределении вакцин в этом

материале?

Обратите внимание на фразу “ЮНИСЕФ уже приобрел для Украины много вакцин”.

Page 43: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 43

От фактического материала к репортажу: размышляя, как дата-журналист

Что означает “много” в данном контексте?

Подумайте, как могла бы выглядеть гипотеза дата-журналиста, который работает с этой

информацией.

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Примите во внимание:

● Понятно ли, сколько всего вакцин было заказано Минздравом Украины в рамках

соглашения с международными организациями?

● Какую часть из этого составляет 2,5 миллиона вакцин, которые только что

получены?

● Как будут распределяться вакцины по регионам, возникают ли проблемы при

распределении вакцин по больницам?

● Какие еще данные необходимы, чтобы подать информацию в контексте?

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 44: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 44

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: здравоохранение - экономика

Page 45: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 45

От фактического материала к репортажу: размышляя, как дата-журналист

Прочитайте эту статью о изменениях средней продолжительности жизни в России:

http://www.kp.md/daily/26582/3598229/?geo=0&utm_campaign=desktopmd

Насколько заголовок отражает содержание статьи?

Каким образом менялась динамика по различным социальным показателям, которые влияют на

среднюю продолжительность жизни в стране?

Как эти данные встраиваются в общемировую тенденцию?

Какие факторы могут повлиять на повышение пенсионного возраста, кроме изменения средней

продолжительности жизни?

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 46: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 46

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: экономика

В этой статье говорится о том, что, по мнению экспертов, тарифы на электроэнергию в Молдове

были повышены ошибочно: https://point.md/ru/novosti/obschestvo/eksperti58-termoelectrica-

oshibaetsya-tarifi-dolzhni-bitj-snizheni-minimum-na-20

Обратите внимание на фразу “ученые сообщили, что тариф можно снизить минимум на 20%, если

использовать все ресурсы предприятия Termoelectrica, а также привлечь инвестиции”.

Чтобы выяснить, правы ли эксперты, вам потребуются и их данные, и данные “с другой стороны”.

Как могла бы звучать гипотеза, если бы над этой статьей работал дата-журналист?

Page 47: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 47

От фактического материала к репортажу: размышляя, как дата-журналист

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Примите во внимание:

- Какова официальная причина повышения тарифов на электроэнергию?

- Какие доказательства, расчеты, доклады представили эксперты в доказательство своего

утверждения?

- Есть ли ответное мнение AO Termoelectrica? Какова позиция НАРЭ?

- Где можно найти данные о тарифах электроэнергии и их изменении за последние годы?

- Какие еще наборы данных могут помочь ответить на вопрос о правомерности повышения

тарифов?

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 48: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 48

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: экономика

Page 49: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 49

От фактического материала к репортажу: размышляя, как дата-журналист

Прочтите вот эту статью об изменении индекса деловой активности в Узбекистане:

https://www.gazeta.uz/ru/2016/08/29/ida/

Понятно ли читателю, каков индекс экономической активности в Узбекистане на июль 2016 года -

1310 пунктов или 1001 пункт?

Что на практике означает этот индекс? Понятно ли, из каких и скольких компонентов он

складывается?

Объясняет ли заголовок представленные в материале данные?

Является ли рост индекса на 0,1 % хорошим или плохим показателем?

Какое самое сильное изменение по компонентам индекса произошло за последний месяц? Не

является ли понижение активности бизнеса по защите и использованию прав собственности на

торговые марки практически на треть более весомым новостным поводом для заголовка? Можно

ли узнать, чем обусловлено это падение?

Подумайте, как могла бы выглядеть гипотеза дата-журналиста:

Гипотеза:_____________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

________

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 50: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 50

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: экономика

Page 51: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 51

От фактического материала к репортажу: размышляя, как дата-журналист

Перед вами классический пример статьи об инфляции с изложением сухих фактов:

http://vesti.az/news/295339

Такая статья не объясняет, как изменения уровня инфляции или процентное изменение цен на

товары влияет непосредственно на кошелек граждан Азербайджана.

Какие данные помогут поместить инфляцию в контекст?

Как изменение цен на товары влияет на расходы бюджета в средней азербайджанской семье?

Сколько человек содержит на свою зарплату среднестатический азербайджанец?

Как можно рассказать об изменении цен на товары, чтобы это было интересно широкой

аудитории?

Гипотеза:_____________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

________

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 52: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 52

От фактического материала к репортажу: размышляя, как дата-журналист

Улучшаем истории с помощью данных: международное сотрудничество

Page 53: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 53

От фактического материала к репортажу: размышляя, как дата-журналист

Прочитайте заметку о финансировании проектов в рамках программы “Восточное партнерство”:

http://vesti.az/news/306278.Как могла бы звучать гипотеза?

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Примите во внимание

● Несмотря на то, что в заметке приведен общий объем финансирования и бюджеты трех

крупнейших проектов, информации все же недостаточно, чтобы понять, как конкретно

будут распределяться эти деньги, по какому принципу они будут распределяться между

странами-участницами программы, а также как соотносится помощь в рамках этой

программы с другими программами международного сотрудничества. Можете ли Вы

найти:

● Каков объем финансирования по программе на протяжении последних лет?

● Как распределяется сумма между странами-участницами? На какие проекты тратятся

деньги? Можно ли посчитать финансирование по секторам? По регионам? На душу

населения?

● Какой объем международной помощи получают эти страны помимо программы

“Восточное партнерство”?

● Какие данные существуют по отчетности об израсходованных средствах?

Вопросы:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Page 54: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 54

От фактического материала к репортажу: размышляя, как дата-журналист

Упражнение: дата-подход к историям, которые представляют общественный интерес

В этом упражнении мы будем рассматривать темы, которые представляют общественный интерес,

с точки зрения данных. Это значит, что для освещения этих тем нужно будет проанализировать

релевантную статистику, поместить ситуацию в надлежащий контекст и объяснить происходящее с

помощью данных.

Представьте, что новостной повод - это повод для вас как для журналиста “копнуть глубже” и

провести дата-анализ того или иного феномена. Перед вами несколько тем. Придумайте для

каждой из них гипотезу, которая могла бы объяснить ситуацию с помощью данных, и укажите,

какие данные Вам понадобятся.

● Правительство решило заменить осеннюю индексацию пенсий на разовую выплату

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

● Уровень занятости упал до самой низкой за последние 12 лет отметки

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Page 55: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 55

От фактического материала к репортажу: размышляя, как дата-журналист

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

● Больничный сектор переживает массовое снижение числа врачей

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

● Состояние экологии области признано критическим

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

Page 56: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 56

От фактического материала к репортажу: размышляя, как дата-журналист

● Модернизация библиотек требует денег, которых у области нет

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

● В городе отмечается острая нехватка детских садов на фоне масштабной застройки нового

жилья

Гипотеза:

_____________________________________________________________________________________

_____________________________________________________________________________________

____________________________________________________________________________

Данные:

_____________________________________________________________________________________

_______________________________________________________________________________

Page 57: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 57

От фактического материала к репортажу: размышляя, как дата-журналист

Упражнение: Проанализировать данные

Обзор

В этом упражнении мы проанализируем собранные и визуализированные данные. Это обзор

сферы здравоохранения в вашей стране. Цель в том, чтобы интерпретировать данные, начать

изучать источники данных, определить, что самое интересное в данных, написать гипотезу и

составить репортаж на основе выводов.

Для начала, откройте одну из ссылок:

Глобальное бремя болезней, травм и факторов риска:

http://www.healthdata.org/results/country-profiles

Профиль страны согласно ВОЗ:

● http://www.who.int/gho/countries/en/ (Выберите страну, выберите профиль страны,

и общие статистические данные ВОЗ)

● Страна в профиле ЮНИСЕФ

http://www.unicef.org/infobycountry/ (Выберите страну и выберите статистику)

Предпосылки

Для каждого из источников данных, ответьте на следующие вопросы:

1. Кто собрал данные?

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

2. Когда были собраны данные?

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

3. Какой период времени покрывают данные?

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

Page 58: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 58

От фактического материала к репортажу: размышляя, как дата-журналист

4. Как собирались данные?

______________________________________________________________________________

______________________________________________________________________________

______________________________________________________________________________

Понимание показателей

Что означают показатели?

Могу ли я найти определение показателей, которые я не понимаю?

Каковы различия между категориями?

Какие показатели не включены в эти данные, где не хватает контекста?

Подчеркните 3-5 фактов, которые помогут ответить на эти вопросы

Что интересного и удивительного в этих данных?

Могут ли эти данные помочь гражданам принимать более обоснованные

решения о своем здоровье?

Могут ли эти данные помочь директивным органам принимать более

обоснованные решения о расходах на здравоохранение?

Могут ли эти данные объяснить картину тенденций в области здравоохранения

в стране?

Гипотеза

Запишите гипотезу о том, что вы можете доказать с помощью этих данных:

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Подготовка репортажа

Упорядочьте ваши данные

Начните с наиболее важных данных, которые могут дать ответы на ваши

вопросы;

Добавьте подробности или сведения о тенденции;

Page 59: Модуль Модуль 2: От фактического материала к репортажуСовременный анализ данных происходит с помощью

Модуль 2: От фактического материала к репортажу 59

От фактического материала к репортажу: размышляя, как дата-журналист

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Напишите репортаж

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

_____________________________________________________________________________________

Оцените репортажи

1. Отвечает ли репортаж на вопрос гипотезы?

2. Каждый ли элемент данных в репортаже подтверждает гипотезу?

3. Расположены ли элементы данных в репортаже в логическом порядке?