资源简介
基于字的二元模型的拼音输入法,字的三元模型会爆内存。
代码片段和文件信息
import numpy as np
f = open(“D:\\拼音输入法作业\\拼音汉字表.txt“)
lines = f.readlines()
f.close()
f = open(“D:\\拼音输入法作业\\拼音汉字表.txt“)
letters = f.read()
letters = letters.split()
f.close()
count = len(letters)-len(lines)
lettertype = np.dtype([(‘letter‘ ‘U1‘ 1) (‘pinyin‘ ‘U6‘ 2) (‘count‘ ‘i‘ 1) (‘lettercount‘ ‘O‘) \
(‘p‘ ‘O‘)])
#lettertype = np.dtype({‘names‘: [‘letter‘ ‘pinyin‘ ‘count‘ ‘pcount‘ ‘p‘] ‘formats‘: [‘U1‘ ‘U6‘ ‘i‘ ‘i‘ ‘f‘] ‘itemsize‘: []})
types = np.array([(‘‘ [‘‘]*2 0 [0]*count [0.]*count)]*(count+1) dtype=lettertype)
j = 0
for line in lines:
line = line.split()
for i in range(1 len(line)):
types[j+i-1][‘letter‘] = line[i]
types[j+i-1][‘pinyi
- 上一篇:ID3算法,详解+Python代码实现
- 下一篇:视频中的人脸识别
评论
共有 条评论