«Анализ данных в среде R»

Коллеги, мы рады пригласить вас на серию мастер-классов по анализу данных в среде R, которые пройдут в рамках конференции «Психология XXI века» 26-28 апреля в Санкт-Петербурге.
Особенность R в том, что это – стремительно развивающийся и набирающий популярность язык программирования для статистической обработки данных и работы с графикой. В настоящее время R широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом в своей области. Наиболее привлекательные строны языка R – высокая гибкость, огромное сообщество пользователей и разработчиков. Бесплатность пакета делает его серьезной альтернативой таким коммерческим пакетам для анализа данных, как IBM SPSS или Statistica.

Мы предлагаем вам принять участие в нескольких мастер-классах, на которых наши коллеги из МГУ и СПбГУ расскажут об основных принципах R, поделятся опытом решения основных задач, возникающих при анализе данных психологических исследований. Некоторое время будет уделено и новым идеям в сфере анализа данных и представления результатов анализа.

Наша цель – представить психологам-исследователям новый и перспективный инструмент для анализа данных, а также встретиться и познакомиться с теми, кто занимается статистическим анализом данных исследований, интересуется R и новыми идеями в количественной психологии.

Пожелания к участникам
— знание базовых методов анализа данных в психологии или смежных науках (желательно в объеме учебника А.Д.Наследова «Математические методы психологического исследования. Анализ и интерпретация данных» или его аналогах);
— умение работать в каком-либо стат.пакете для анализа данных (SPSS, Statistica, Stata, Matlab, R, SAS и проч.).

Ведущие мастер-классов:

Иван Воронин Психологический институт РАО, лаборатория возрастной психогенетики; МГУ, факультет психологии. Интересы: все, что связано с R и мат.методами

Марат Зайнутдинов СПбГУ, факультет психологии, лаборатория психофизиологии. Интересы: Big data analysis, machine learning, AI

Андрей Четвериков СПбГУ, факультет психологии, лаборатория когнитивной психологии. Интересы: мешанные модели, анализ взаимодействий, контрасты, бутстреп, структурное моделирование, проблемы p, IRT, SDT.

Программа:

26 апреля
18.00-19.00 Иван Воронин Введение в R
19.20-20.20 Марат Зайнутдинов Описательные статистики и проверка гипотез в R

27 апреля
13.00-14.00 Марат Зайнутдинов Многомерные методы: факторный анализ
14.15-15.15 Андрей Четвериков Регрессионный анализ и смешанные модели
15.30-16.30 Андрей Четвериков Графики и представление результатов в R
16.45-18.00 Иван Воронин Literate Statistical Practice

Аннотации мастер-классов

Иван Воронин Введение в R

Каждый психолог-исследователь в своей деятельности неизбежно сталкивается с необходимостью производить статистический анализ. Обычно исследователь использует те средства статистической обработки, пользоваться которыми он научен. Это как правило коммерческие статистические пакеты вроде SPSS, Statistica, Stata и проч. Они предоставляют пользователю дружелюбный оконный интерфейс, пользоваться которым легко и просто.
Однако функциональность коммерческих статистических пакетов, как правило, ограничена средствами, реализованными командой разработчиков. Исследователь, столкнувшийся с задачей, слегка выходящей из круга типовых (к примеру, его данные демонстрируют «неудачное» распределение), обнаруживает, что его статистический пакет не предоставляет средств для решения поставленной задачи. В рамках данного мастер-класса вы познакомитесь с системой статистического программирования R, выступающей в качестве альтернативы всем коммерческим статистическим пакетам. Я покажу, за счет чего R обгоняет по функциональности любой коммерческий статистический пакет.

Марат Зайнутдинов Описательные статистики и проверка гипотез в R

На примерах рассмотрим основные статистические понятия: среднее, дисперсия, бутстреппинг, вид распределения, квантили, сравнение средних, таблица сопряженности и анализ частот, дисперсионный анализ. Каждая функция рассматривается на примере, взятом из научной практики.

Марат Зайнутдинов Многомерные методы: факторный анализ

Самый обычный простейший факторный анализ и его брат многомерное шкалирование. О том, как их считать в R. (с примерами).

Андрей Четвериков Регрессионный анализ и смешанные модели

Основные виды линейных регрессионных моделей — простая линейная, логистическая, порядковая регрессия. Диагностика модели. Проблема взаимодействий. Краткий экскурс в анализ с повторными измерениями с применением смешанных моделей.

Андрей Четвериков Графики и представление результатов в R

Базовые графические возможности R. Графики рассеивания, гистограммы, столбиковые диаграммы, и все остальное. Пакет lattice. Основные возможности пакета ggplot2.

Иван Воронин Literate Statistical Practice

Практика статистической обработки данных в рамках научного исследования включает в себя множество разнообразных процедур и операций. Сюда входят как подготовка данных и проверка допущений, применение статистических критериев и моделирование, так и презентация результатов в разных формах, коммуникация исполнителя с заказчиком и многое другое из того, что не имеет непосредственного отношения к статистике. В отчетах по анализу многие элементы этого процесса как правило опускаются: представляются только общий путь анализа и результаты в конечной форме. От этого исследование в значительной степени теряет свою воспроизводимость. Подход «Грамотная Статистическая Практика» (Literate Statistical Practice) призван ликвидировать эту проблему за счет того, что процесс статистического анализа сливается с его описанием. Анализ, выполненный в ключе этого подхода, может быть воспроизведен на любом шаге с получением одних и тех же результатов. Это делает анализ в целом более прозрачным и качественным и облегчает коммуникацию между исследователями.

На мастер-классе я покажу инструментарий, позволяющий реализовывать подход «Грамотная Статистическая Практика» (система статистического программирования R, система верстки текста TeX), продемонстрирую различные формы презентации статистического анализа, а также попытаюсь убедить слушателя, что данный подход позволяет не только производить продукт высокого уровня, но и облегчает деятельность самого исследователя.

Анкета участника

К сожалению, количество мест на участие в мастер-классах ограничено, поэтому, при большом числе заинтересованных, мы будем проводить конкурсный отбор на основе данных анкет.

Анкета расположена здесь: http://goo.gl/euvbW