资源简介
最大概率分词算法,带详细源码
基于最大概率的汉语切分
目标:采用最大概率法进行汉语切分。
其中:n-gram用bigram,平滑方法至少用Laplace平滑。
输入:接收一个文本,文本名称为:corpus_for_test.txt
输出:切分结果文本,
其中:切分表示:用一个字节的空格“ ”分隔,如:我们 在 学习 。
每个标点符号都单算一个切分单元。
输出文件名为:学号.txt
代码片段和文件信息
相关资源
- 一种隐含并行的大规模三相不平衡配
- Berlekamp-Massey算法
- AP聚类算法代码
- 队列实现火车厢重排的算法及代码个
- 中文网页自动分类器
- VRP问题蚁群算法
- 基于栅格化的A*路径算法规划基于Si
- 信号与数据处理中的低秩模型——理
- 自己整理的国标SM3哈希算法
- Caley树算法 计算机图形学 孔令德 案例
- 多边形边缘填充算法 计算机图形学
- 几种常用music算法
- 严题集算法设计答案汇总
- 蚁群算法简单实现
- 语音压缩算法,比较简单
- 严蔚敏清华大学数据结构和算法视频
- SAR雷达CS算法面目标成像算法
- 连通图tarjan算法动画讲解呕心沥血之
- ACM 竞赛常用算法与数据结构
- 人脸识别完整代码包括PCA_LDA算法
- 密码学课程设计:仿射加密解密算法
- 进阶01——考虑换乘的基于路径长度的
- FW_BPR算法计算过程.txt
-
Item ba
sed collaborative filtering recommen - 中文停用词库 chineseStopWords.txt
- 蚁群优化算法源代码,源程序
- 祖冲之密码算法
- 一种高效的聚类算法.pdf
- 神经网络算法源程序
- 各种排序 插入法排序、起泡法改进算
评论
共有 条评论