资源简介
该程序是一个java的中文汉字字频统计,从诸如txt文件中读取语料,然后生成一个前100个高频汉字的字频统计结果的txt文件,并且还会生成前100、200、600、2000、等汉字的字频和的另一个txt文件。该程序是借用treeMap来实现数据的储存的,很方便。输入语料文件名时是要输入全名的,例如:E:\1.txt
代码片段和文件信息
import java.util.*;
import java.io.*;
import java.math.*;
public class Tongji implements Comparatorject>
{
private static TreeMap treeMap = new TreeMap();
public static int totalNum = 0;
public static int totalKind = 0;
public static float sum1 sum20 sum100 sum600;
public static float sum2000 sum3000 sum6000;
public static float shang;
public int compare(object o1 object o2)
{
// TODO Auto-generated method stub
return -((Map.Entry)o1).getValue()+((Map.Entry)o2).getValue();
}
public static void main(String[] args)throws Exception
{
System.out.println(“请输入文件名称:“);
Scanner sc = new Scanner(System.in);
String fileName = sc.nextLine();
BufferedReader reader = new BufferedReader(new FileReader(fileName));
String line;
while((line = reader.readLine())!=null)
{
for(int i = 0;i {
char c = line.charAt(i);
if((c>=0x4e00)&&(c<=0x9fbb))
{
totalNum ++;
String cStr = String.valueOf(c);
if(treeMap.containsKey(cStr))
{
treeMap.put(cStr treeMap.get(cStr)+1);
}
else
{
treeMap.put(cStr 1);
totalKind ++;
}
}
}
}
object []stats = treeMap.entrySet().toArray(); //用Arrays类的静态方法为treeMap按字频排序
Arrays.sort(statsnew Tongji());
Listject> list = Arrays.asList(stats); //转成List以便排序
FileWriter writer1 = new FileWriter(fileName+“—前100汉字统计结果.txt“); //输出前100个汉字
writer1.write(“汉字总数\t= “+totalNum+“\r\n“);
writer1.write(“汉字种数\t= “+totalKind+“\r\n“);
writer1.write(“*************************\r\n“);
writer1.write(“前100汉字高频字的频率统计结果\r\n“);
writer1.write(“序号 汉字 = 个数 字频\r\n“);
int lastFreq = -1;
- 上一篇:一个模拟Windows的画图程序 java版
- 下一篇:动态sin和cos函数图像
相关资源
- u-blox_Android_GNSS_Driver_v3.10驱动源码+中
- java读取DBF解决方案(可以解决javadb
- Android安卓中文API开发文档参考手册官
- spring3.0 API 中文 CHM文档
- think in java中文第五版
- pdf-chinese.zip
- java ee api中文版
- J2EE(中文版)(CHM版)
- J2EE中文版api doc文档
- android studio 3.2 中文补丁直接替换可用
- 中文分词器(mmseg4j + luncene5.X)源码
- 中文数字转成阿拉伯数字 java 实现
- Smali指令中文手册
- 《Java编程艺术》中文版pdf以及源代码
- 全世界最经典的数据结构教材,Horo
- Hibernate in action 中文版 实战 part_3
- Android 渗透测试学习手册 中文版
- adb push不支持中文乱码的解决方案
- IKAnalyzer2012.jar
- JavaWeb中文件上传最强工具类
- Java汉字转拼音支持多音字
- java汉字转拼音代码+多音字词汇表
- Google Java 编程规范中文版
- Head First Java.第二版.中文完整高清版
- 《Effective Java 第2版》完整高清版中文
- Java编程思想(中文版)Thinking In Jav
- ThinkingInJava4(完美高清中文版).rar
- StarUML5.0中文汉化版文件.zip
- Jperf-2.0.0网络测速-中文版
- spring-boot-中文文档.pdf
评论
共有 条评论