Инженер, если по диплому)
Просто предполагаю, что была взята большая выборка человек, словарный запас которых известен, после чего искали "слова-маркеры", чаще встречающиеся именно у людей с большим словарным запасом. По очевидным причинам это слова редкие. Для теста оставили два десятка, дававшие приемлемый коэффициент корреляции. Результат теста по 200-400 менее специфических слов, конечно, давал бы более точный результат, но занял бы больше времени.