用于语言查询和字数统计的开源库 (LIWC) [已关闭]

2022-09-04 04:59:02

我正在寻找一个用于语言查询和字数统计(LIWC)的开源库。Java或python中的东西会很好,尽管我愿意使用其他语言。

有谁知道我在哪里可以得到一个?

干杯


答案 1

正如ealdent所指出的,LIWC既是软件又是数据集。数据集是专有的,因此没有开源版本。对于软件方面,TAWC是一个有用的开源Perl版本。从评论中:

这是一个半复杂的脚本,改编自我的CHI论文中使用的脚本。此脚本的任务是从字典中读取正则表达式(或者如果它们不是 RE,则将其转换为 RE),这些字典必须与 LIWC 软件集 (c.f. http://www.liwc.net) 向后兼容。然后,它计算单个输入行/用户中 RE 的匹配项数,并为该行/用户输出该匹配项。

然后,您可以购买LIWClite,其成本不到LIWC的一半。您还可以免费将TAWC与您自己的字典一起使用。


答案 2

你可能会发现Python的自然语言工具包(NLTK)很有用:http://www.nltk.org/