Когнитивная психология и эмоции
Субъективные заметки аспиранта-психолога
Записи в рубрике «визуализация»

Grouped forest plots using ggplot2

19 июля 2012, анализ данных Метки: , , , , ,

I decided to write this post in English, as I need to practice in writing more.

As I currently do some meta-analytic stuff, I needed to get a proper plot of the results of analysis. The existing solutions are hard to customize, so I decided to do something by myself. Basically, the forest plot is a errorbar plot of effect sizes, plus a list of studies, plus some other stuff, usually a list of effect sizes.
продолжение »

Интересный графичек

7 июля 2012, анализ данных Метки: ,

По сути это jitter plot но с фиксированным сдвигом для точек. Ну и на смесь dot plot и volcano plot похоже. Раньше такого не видел.

Диапазон долей правильных ответов

Диапазон долей правильных ответов

Почему в 99% случаев не стоит использовать 3D диаграммы и графики

15 июня 2012, анализ данных Метки: , , ,

3D диаграммы и графики очень часто используются для представления данных, что в работах студентов, что в журналах, что в бизнесе. Основная идея, стоящая за этим безобразием, выражена в вики весьма ясно: «Изображение в объёмном виде упрощает понимание информации. Такие диаграммы выглядят убедительнее». Что характерно, в качестве авторитетного источника к этому утверждению указан совершенно левый сайт.

На деле трехмерные диаграммы в большинстве случаев затрудняют и искажают восприятие информации. Мнение нормальных людей на эту тему хорошо выражено на следующей диаграмме:

Круговая диаграмма в 3D

Для круговых 3d диаграмм искажение данных это самая большая проблема. Все очень просто, величину переменной на круговой диаграмме отражает площадь куска диаграммы. Однако если в 3d, во-первых, появляются искажения, связанные с объемом куска диаграммы, а во-вторых, искажения, связанные с перспективой. Вот, например, три диаграммы, построенные на одних и тех же значениях:

Пример того, чем плохи трехмерные круговые диаграммы

Пример того, чем плохи трехмерные круговые диаграммы

Первая диаграмма более-менее отражает реальные данные, хотя и не лучшим образом — она позволяет сказать, что фиолетовая, голубая, оранжевая и зеленая части равны, но достаточно трудно сказать, что они в ровно два раза меньше красной. Вторая диаграмма (верхняя правая) добавляет объем и перспективу, третья (нижняя) — не так много объема, зато дополнительный эффект перспективы. Уже на второй диаграмме зеленая часть визуально больше фиолетовой и голубой, а вопрос о равенстве зеленого и оранжевого куска может вызвать у зрителя мучительные сомнения. На нижней же диаграмме утверждение о том, что зеленый кусок равен оранжевому, заставит усомниться в психическом здоровье докладчика.

В случае столбиковых диаграмм основная проблема продолжение »

Точечная гистограмма в R (dotplot, ggplot2)

25 марта 2012, анализ данных Метки: , , , ,

В ggplot2 версии 0.9.0 добавился интересный вариант визуализации данных — dotplot. По сути это гистограмма, которая отражает напрямую количество наблюдений. Не знаю, как это по другому описать, просто взгляните на график:

Dotplot + density plot, ggplot2

Dotplot + density plot, ggplot2

Линиями отражено распределение плотности, «точками» — наблюдения. Шкала x — средняя точность ответов. Данные представлены для двух групп из одного из моих экспериментов. На графике четко видно, что в обеих группах есть люди, которые просто не прочитали инструкцию, или прочитали неправильно (точность 0.1 — правильный ответ на уровне шанса) =)

Делается такой график вполне просто:

> ggplot(data=art_ev_aggr,aes(x=accuracy)) 
+ geom_density(aes(linetype=factor(target_time),y=..scaled..)) 
+ geom_dotplot(dotsize = .5,aes(size=2, fill=factor(target_time)))
+ labs(fill="Target time", linetype="Target time")

Представление результатов психологических исследований: рекомендации APA и визуализация данных

28 октября 2011, анализ данных Метки: , , , ,

Презентация со вчерашей встречи Statgeeks.

Транскрипт: продолжение »