Суть в чем — есть идея по анализу связи самоотчета испытуемых о своих эмоциях, неосознанного проявления значимости этих эмоций через задачи типа лексического решения и статистики встречаемости различных слов, связанных с эмоциями.

Пока что анализирую старый материал (2006г) — там 700 блогов по 20 последних постов из каждого.  Составить список слов (точнее регулярных выражений, т.е. своего рода шаблонов для распознавания слов) оказалось не так просто. Слова горе и вина к примеру — «к горе Эверест» или «крепкие вина» от «себе на горе» и «вина моя велика» можно отличить только по контексту. Но в итоге все-таки получился список из 240 выражений для 10 базовых эмоций по Изарду.

Результаты пока такие:

interest 16,99% 9,24%
joy 34,75% 21,01%
surprise 2,53% 5,46%
sadness 12,25% 18,49%
anger 7,27% 12,18%
disgust 3,59% 6,72%
contempt 0,62% 5,04%
fear 15,32% 10,92%
shame 3,34% 5,88%
guilt 3,34% 5,04%

Второй столбец — % слов, связанных с этой эмоцией по всей выборке. Третий — % слов в созданном словаре. На презрение выпало как-то удивительно мало совпадений. Имхо, это связано с частым выражением презрения через обесценивание объекта, а не через экспрессию чувств. Проще сказать «Ваня — чмо!» чем «Ваня, я тебя презираю». Ну и как-то очень близко презрение с отвращением стоят. На вину также, имхо, парадоксально мало, несмотря на то, что там встречаются слова совесть и преступник.