气象学系"])。
jieba.load_userdict("userdict.txt")jieba.load_userdict("userdict.txt")。
word_list = jieba.lcut("河南财政税务高等专科学校气象学系")word_list = jieba.lcut("河南财政税务高等专科学校气象学系")。
# 提取六级词汇# 提取六级词汇。
six_list = get_six("sifa.txt")six_list = get_six("sifa.txt")。
# 提取考研词汇# 提取考研词汇。
kaoya_list = get_kaoya("kaoya.txt")kaoya_list = get_kaoya("kaoya.txt")。
# 计算出现的频率# 计算出现的频率。
words_dict = {}words_dict = {}。
for word in word_list:for word in word_list:。
if word in words_dict:if word in words_dict:。
words_dict[word] += 1words_dict[word] += 1。
else:else:。
words_dict[word] = 1words_dict[word] = 1。
# 计算六级词汇的频率# 计算六级词汇的频率。
河南财政税务高等专科学校 six_dict = {}six_dict = {}。
for word in six_list:for word in six_list:。
if word in words_dict:if word in words_dict:。
six_dict[word] = words_dict[word]six_dict[word] = words_dict[word]。
# 计算考研词汇的频率# 计算考研词汇的频率。
kaoya_dict = {}kaoya_dict = {}。
for word in kaoya_list:for word in kaoya_list:。
if word in words_dict:if word in words_dict:。
kaoya_dict[word] = words_dict[word]kaoya_dict[word] = words_dict[word]。
# 计算生词数量# 计算生词数量。
new_words = set(words_dict) - set(six_list) - set(kaoya_list)new_words = set(words_dict) - set(six_list) - set(kaoya_list)。
new_words_len = len(new_words)new_words_len = len(new_words)。
print("文章中共包含{}个单词".format(len(words_dict)))print("文章中共包含{}个单词".format(len(words_dict)))。
print("文章中共包含{}个六级单词".format(len(six_dict)))print("文章中共包含{}个六级单词".format(len(six_dict)))。
print("文章中共包含{}个考研单词".format(len(kaoya_dict)))print("文章中共包含{}个考研单词".format(len(kaoya_dict)))。
print("文章中共包含{}个生词".format(new_words_len))print("文章中共包含{}个生词".format(new_words_len))。