5 мая 2009, эксперимент
Метки: анаграммы, слова, тесты, эксперимент, эмоции
Упрощенная и облегченная версия предыдущего теста (который «Сколько в Вас от настоящего разведчика?»).
Собственно, упрощение заключается в том, что оставлено только одно задание — решение анаграмм. Может быть поможет. Ссылки приветствуются, если будет проходить, напишите, пожалуйста, в конце, решали ли Вы эти анаграммы ранее.
| Тест «Анаграммайзер»
Я решаю анаграммы в среднем за 2273мс. По сравнению с другими участниками, эффективность 74%
Пройти тест, помочь науке
|
1 декабря 2008, эксперимент
Метки: оценка текстов, слова, эксперимент, эмоции
… чтобы всех их единою волей сковать =) Мои обожаемые эксперты завершили оценку текстов, которая окончательно покажет, был ли смысл в разработанной мной системе автоматического анализа эмоционального содержания текстов. В связи с этим вопрос к уважаемой публике: какие методы стат.обработки лучше применить?
Необходимо вычислить, насколько оценки системы соответствуют оценкам экспертов, желательно по каждой шкале отдельно. Я знаю, что умные люди аналогичную задачу решали с помощью вычисления сначала среднего коэффициента корреляции (Пирсона) между экспертами по каждой шкале, затем сравнивали этот коэффициент со средним коэффициентом корреляции автоматической системы и экспертов. Но мне такой путь не очень нравится, поскольку усреднение коэффициента корреляции штука транная, да и вообще это все как-то неправильно.
20 октября 2008, эксперимент
Метки: оценка текстов, слова, эксперимент, эмоции
Последние несколько дней вычисляю индексы PMIW. Может быть поможет.

цифры - циферки, слова - словечки
Индекс PMI (Pointwise Mutual InformationW) позволяет оценить, насколько какие-либо слова связаны друг с другом. Я пытаюсь применять его для оценки эмоциональности текстов на русском.
30 сентября 2008, эмоции
Метки: слова, эксперимент, эмоции
Решил ради интереса выложить список слов, который буду использовать для анализа эмоций в блогах. Может кто-нибудь сделает какие дополнения или замечания. Под катом — большой список.
Первый столбец — пример слова, второй — схема его описывающая. Если кто не знаком с паттернами, в общих чертах: [] — класс символов, например [а-я] — символы от а до я, * — любое количество символов, + — количество символов от 1 до бесконечности.
| интересный |
интерес[а-я]* |
| заинтересованность |
заинтерес[а-я]* |
| заинтригованность |
заинтриг[а-я]* |
| любопытство |
любопыт[а-я]* |
| увлечение |
увлеч[а-я]* |
| увлеченность |
увлекат[а-я]* |
| неравнодушие |
неравнодуш[а-я]* |
| Внимательный |
внимате[а-я]* |
| Бдительный |
бдит[а-я]* |
| сосредоточенный |
сосредоточ[а-я]* |
| заметливый |
заметл[а-я]* |
| наблюдательный |
наблюдат[а-я]* |
| приметливый |
приметл[а-я]* |
| примечать |
примеча[а-я]* |
| пристальный |
пристальн[а-я]* |
| сфокусированный |
сфокусир[а-я]* |
| тщательный |
тщательн[а-я]* |
| Собранный |
Собранн[а-я]* |
| занимательный |
занимательн[а-я]* |
| занятный |
занятн[а-я]* |
| животрепещущий |
животрепещ[а-я]* |
| курьезный |
курьезн[а-я]* |
|
|
|
| балдеющий |
балде[а-я]* |
| бескручинный |
бескручин[а-я]* |
| беспечальный |
беспечал[а-я]* |
| благодатный |
благодат[а-я]* |
| благоденственный |
благоден[а-я]* |
| благодушествующий |
благодуш[а-я]* |
| Благополучный |
благополучн[а-я]* |
| благоприятный |
благопри[а-я]* |
| блаженствующий |
блаженс[а-я]* |
| Веселье |
весел[а-я]* |
| вкушающий |
вкуша[а-я]* |
| восторг |
востор[а-я]* |
| воодушевление |
воодуш[а-я]* |
| жизнерадостный |
жизнерад[а-я]* |
| забава |
забав[а-я]* |
| задорный |
задорн[а-я]* |
| игривый |
игрив[а-я]* |
| кайфующий |
кайф[а-я]* |
| ликование |
ликов[а-я]* |
| Наслаждающийся |
наслажд[а-я]* |
| нежащийся |
нежа[а-я]* |
| неунывающий |
неунываю[а-я]* |
| оживленный |
оживл[а-я]* |
| отрада |
отрад[а-я]* |
| оттягивающийся |
оттяг[а-я]* |
| плющащийся |
плющащ[а-я]* |
| потеха |
потех[а-я]* |
| праздничный |
праздничн[а-я]* |
| Радость |
радост[а-я]* |
| развлечение |
развл[а-я]* |
| сияющий |
сияющ[а-я]* |
| смакующий |
смак[а-я]* |
| солнечный |
солнечн[а-я]* |
| Счастливый |
счаст[а-я]* |
| тащащийся |
тащ[а-я]*ся |
| торжествующий |
торжеств[а-я]* |
| увеселение |
увесел[а-я]* |
| удовольствие |
удов[ол][а-я]* |
| упивающийся |
упив[а-я]* |
| услаждающийся |
услажд[а-я]* |
| утеха |
утех[а-я]* |
|
|
раду[а-я]* |
|
|
рад[а-я]? |
|
|
лику[а-я]* |
|
|
довольн[а-я]* |
|
|
обалден[а-я]* |
|
|
прет |
|
|
щаст[а-я]* |
|
|
приятн[а-я]* |
| вдохновение |
вдохно[а-я]* |
|
|
|
| Изумление |
изумл[а-я]* |
| недоумение |
недоуме[а-я]* |
|
|
озадачит[а-я]* |
| огорошенный |
огорош[а-я]* |
| Озадаченный |
озадачен[а-я]* |
| охеревший |
охерев[а-я]* |
| ошарашенный |
ошараш[а-я]* |
| шокированный |
шокирован[а-я]* |
| ошеломляющий |
ошеломл[а-я]* |
| Пораженный |
пораженн[а-я]* |
| растерянный |
растерян[а-я]* |
| Удивленный |
Удивл[а-я]* |
| Охреневший |
охреневш[а-я]* |
|
|
|
| Безотрадный |
безотрад[а-я]* |
| безрассветный |
безрассвет[а-я]* |
| безутешный |
безутешн[а-я]* |
| будто в воду опущенный |
(как|будто|словно) в воду опущ[а-я]* |
| Горе |
горе |
|
|
горя |
|
|
горем |
|
|
горева[а-я]* |
|
|
горю[юеш]?[а-я]* |
| горесть |
горес[а-я]* |
| горечь. |
гореч[а-я]* |
| горький |
горьк[а-я]* |
| грусть |
груст[а-я]* |
| жалкий |
жалк[а-я]* |
| жалобный |
жалобн[а-я]* |
| жалостный |
жалост[а-я]* |
| ипохондрия |
ипохондр[а-я]* |
| кручина |
кручи[а-я]* |
| меланхолический |
меланх[а-я]* |
| минорный |
минорн[а-я]* |
| мрачный |
мрачн[а-я]* |
| обломанный |
обломан[а-я]* |
| огорченный |
огорч[а-я]* |
| опечаленный |
опечал[а-я]* |
| отчаяние |
отча[а-я]* |
| пасмурный |
пасмурн[а-я]* |
| Печаль |
печал[а-я]* |
| плачевный |
плачевн[а-я]* |
| подавленный |
подавл[а-я]* |
| понурый |
понур[а-я]* |
| прискорбие |
прискорб[а-я]* |
| приунылый |
приуныл[а-я]* |
| разбитый |
разбит[^ъь][а-я]* |
| скорбный |
скорб[а-я]* |
| Сломленный |
сломл[а-я]* |
| соболезнование |
соболезн[а-я]* |
| сокрушение |
сокруш[а-я]* |
| сумрачный |
сумрачн[а-я]* |
| тоска |
тоск[а-я]* |
| траур |
траур[а-я]* |
| угнетенный |
угнетен[а-я]* |
| угрюмый |
угрюм[а-я]* |
| удрученный |
удруч[а-я]* |
| Унылый |
уны[влн][а-я]* |
|
|
|
| бешенство |
бешен[а-я]* |
| буйный |
буйн[а-я]* |
| взбелененный |
взбелен[а-я]* |
| Взбешенный |
взбеш[а-я]* |
| взъяренный |
взъяр[а-я]* |
| Возмущенный |
возмущ[а-я]* |
| Гнев |
гнев[а-я]* |
| досада |
досад[а-я]* |
| жестокий |
жесток[а-я]* |
| запальчивость |
запальч[а-я]* |
| злой |
зло([^дву]+|$)[а-я]* |
| злой |
злы[а-я]* |
| негодование |
негодо[а-я]* |
| негодующий |
негоду[а-я]* |
| обозленный |
обозл[а-я]* |
| ожесточенный |
ожесто[а-я]* |
| озленный |
озлен[а-я]* |
| озлобление |
озлоб[а-я]* |
| остервенелый |
остерв[а-я]* |
| раздосадованный |
раздосад[а-я]* |
| раздражение |
раздраж[а-я]* |
| разозленный |
разозл[а-я]* |
| разъяренный |
разъяр[а-я]* |
| рассвирепевший |
рассвиреп[а-я]* |
| рассерженный |
рассерж[а-я]* |
| свирепость |
свиреп[а-я]* |
| сердитый |
сердит[а-я]* |
| ярость |
ярост[а-я]? |
| бесит |
[а-я]{0,3}?бес[ияю][а-я]* |
|
|
|
|
|
| брезгливость |
брезгл[а-я]* |
| гадкий |
гадк[а-я]* |
| гадливость |
гадли[а-я]* |
| гадостный |
гадост[а-я]* |
| мерзкий |
мерзк[а-я]* |
| мерзопакостный |
мерзо[а-я]* |
| муторный |
муторн[а-я]* |
| омерзение |
омерз[а-я]* |
| омерзительный |
омерз[а-я]* |
| отвратный |
отврат[а-я]* |
| Отвращение |
отвращ[а-я]* |
| пакостный |
пакостн[а-я]* |
| парашливый |
парашл[а-я]* |
| поносный |
поносн[а-я]* |
| противный |
противн[а-я]* |
| тошнота |
тошнот[а-я]* |
|
|
|
| взносчивый |
взносч[а-я]* |
| высокомерный |
высокомерн[а-я]* |
| горделивый |
гордел[а-я]* |
| зазнавшийся |
зазнавш[а-я]* |
| заносчивый |
заносч[а-я]* |
| кичливый |
кичлив[а-я]* |
| надменный |
надмен[а-я]* |
| Презираемый |
презир[а-я]* |
| Презрение |
презр[а-я]* |
| Пренебрегающий |
пренебре[а-я]* |
| спесивый |
спеси[а-я]* |
| чванный |
чван[а-я]* |
|
|
|
| беспокойство |
беспок[а-я]* |
| боязливость |
бояз[а-я]* |
| дрожь |
дрож([^ж][а-я]*) |
| жуткий |
жутк[а-я]* |
| зловещий |
зловещ[а-я]* |
| испуг |
испуг[а-я]* |
| леденящий душу |
леденящ[а-я]* |
| леденящий кровь |
|
| малодушие |
малодуш[а-я]* |
| мандраж |
мандра[а-я]* |
| мнительность |
мните[а-я]* |
| опасение |
опас[а-я]* |
| оторопь |
оторопь |
| отпугивающий |
отпуг[а-я]* |
| паника |
паник[а-я]* |
| Пугающий |
пугающ[а-я]* |
| пугливый |
пугл[а-я]* |
| Страх |
страх([^о]+|$)[а-я]* |
| Страшный |
страш[а-я]* |
| трепет |
трепет[а-я]* |
| трусливый |
тру[сш]([ло]|[ит])[а-я]* |
| угрожающий |
угрожающ[а-я]* |
| угроза |
угроз[а-я]* |
| ужас |
ужас[а-я]* |
| устрашающий |
устраш[а-я]* |
| чудовищный |
чудовищ[а-я]* |
| тревожный |
трево[а-я]* |
|
|
|
| бесстыдный |
бесстыд[а-я]* |
| застенчивость |
застенч[а-я]* |
| застыдчивый |
застыд[а-я]* |
| конфуз |
конфуз[а-я]* |
| позор |
позор[а-я]* |
| постыдность |
постыд[а-я]* |
| Робкий |
робк[а-я]* |
| скромный |
скромн[а-я]* |
| смущающийся |
смущ[а-я]* |
| срам |
срам[а-я]* |
| стеснительный |
стесн[а-я]* |
| Стыд |
стыд[а-я]* |
| унижение |
униж[а-я]* |
| унизительный |
униз[а-я]* |
|
|
|
| Вина |
(об|не|по|из|про)?вин([аынеяу]|ов|(и[^щ]+))+[а-я]* |
| грех |
грех |
| грешный |
греш[а-я]* |
| злодеяние |
злод[а-я]* |
| неправый |
неправ[^и][а-я]+ |
| погрешивший |
погреши[а-я]* |
| преступный |
преступ[а-я]* |
| провинность |
(про|по)винн[а-я]* |
| проступок |
проступ[а-я]* |
| Раскаивающийся |
раскаив[а-я]* |
| согрешение |
согреш[а-я]* |
| Сожалеющий |
сожалею[а-я]* |
8 августа 2008, эксперимент
Метки: слова, эксперимент, эмоции
Суть в чем — есть идея по анализу связи самоотчета испытуемых о своих эмоциях, неосознанного проявления значимости этих эмоций через задачи типа лексического решения и статистики встречаемости различных слов, связанных с эмоциями.
Пока что анализирую старый материал (2006г) — там 700 блогов по 20 последних постов из каждого. Составить список слов (точнее регулярных выражений, т.е. своего рода шаблонов для распознавания слов) оказалось не так просто. Слова горе и вина к примеру — «к горе Эверест» или «крепкие вина» от «себе на горе» и «вина моя велика» можно отличить только по контексту. Но в итоге все-таки получился список из 240 выражений для 10 базовых эмоций по Изарду.
Результаты пока такие:
| interest |
16,99% |
9,24% |
| joy |
34,75% |
21,01% |
| surprise |
2,53% |
5,46% |
| sadness |
12,25% |
18,49% |
| anger |
7,27% |
12,18% |
| disgust |
3,59% |
6,72% |
| contempt |
0,62% |
5,04% |
| fear |
15,32% |
10,92% |
| shame |
3,34% |
5,88% |
| guilt |
3,34% |
5,04% |
Второй столбец — % слов, связанных с этой эмоцией по всей выборке. Третий — % слов в созданном словаре. На презрение выпало как-то удивительно мало совпадений. Имхо, это связано с частым выражением презрения через обесценивание объекта, а не через экспрессию чувств. Проще сказать «Ваня — чмо!» чем «Ваня, я тебя презираю». Ну и как-то очень близко презрение с отвращением стоят. На вину также, имхо, парадоксально мало, несмотря на то, что там встречаются слова совесть и преступник.