资源简介
基于深度学习、语音识别的结巴分词Jieba-Analysis项目,可在Eclipse 和 Android Studio下运行,识别语音的同时,可将关键词分割并输出
代码片段和文件信息
package com.huaban.analysis.jieba;
import java.util.regex.Pattern;
public class CharacterUtil {
public static Pattern reSkip = Pattern.compile(“(\\d+\\.\\d+|[a-zA-Z0-9]+)“);
private static final char[] connectors = new char[] { ‘+‘ ‘#‘ ‘&‘ ‘.‘ ‘_‘ ‘-‘ };
public static boolean isChineseLetter(char ch) {
if (ch >= 0x4E00 && ch <= 0x9FA5)
return true;
return false;
}
public static boolean isEnglishLetter(char ch) {
if ((ch >= 0x0041 && ch <= 0x005A) || (ch >= 0x0061 && ch <= 0x007A))
return true;
return false;
}
public static boolean isDigit(char ch) {
if (ch >= 0x0030 && ch <= 0x0039)
return true;
return false;
}
public static boolean isConnector(char ch) {
for (char connector : connectors)
if (ch == connector)
return true;
return false;
}
public static boolean ccFind(char ch) {
if (isChineseLetter(ch))
return true;
if (isEnglishLetter(ch))
return true;
if (isDigit(ch))
return true;
if (isConnector(ch))
return true;
return false;
}
/**
* 全角 to 半角大写 to 小写
*
* @param input
* 输入字符
* @return 转换后的字符
*/
public static char regularize(char input) {
if (input == 12288) {
return 32;
}
else if (input > 65280 && input < 65375) {
return (char) (input - 65248);
}
else if (input >= ‘A‘ && input <= ‘Z‘) {
return (input += 32);
}
return input;
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-09-18 10:59 Jieba-Analysis\
文件 77 2016-08-23 01:23 Jieba-Analysis\.gitignore
目录 0 2017-09-18 10:59 Jieba-Analysis\bin\
文件 98 2016-08-23 01:23 Jieba-Analysis\bin\build.sh
目录 0 2017-09-18 10:59 Jieba-Analysis\conf\
文件 1006092 2016-08-23 01:23 Jieba-Analysis\conf\sougou.dict
文件 85 2016-08-23 01:23 Jieba-Analysis\conf\user.dict
文件 10273 2016-08-23 01:23 Jieba-Analysis\LICENSE
文件 7194 2016-08-23 01:23 Jieba-Analysis\pom.xm
文件 4886 2016-08-23 01:23 Jieba-Analysis\README.md
文件 4621 2016-08-23 01:23 Jieba-Analysis\README.org
目录 0 2017-09-18 10:59 Jieba-Analysis\src\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\com\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\com\huaban\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\com\huaban\analysis\
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\
文件 1717 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\CharacterUtil.java
文件 9967 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\DictSegment.java
文件 2735 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\Hit.java
文件 8023 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\Jieba
文件 223 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\Node.java
文件 301 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\Pair.java
文件 446 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\SegToken.java
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\viterbi\
文件 8232 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\viterbi\FinalSeg.java
文件 6163 2016-08-23 01:23 Jieba-Analysis\src\main\java\com\huaban\analysis\jieba\WordDictionary.java
目录 0 2017-09-18 10:59 Jieba-Analysis\src\main\resources\
文件 8860738 2016-08-23 01:23 Jieba-Analysis\src\main\resources\dict.big.txt
文件 5071839 2016-08-23 01:23 Jieba-Analysis\src\main\resources\dict.txt
............此处省略11个文件信息
- 上一篇:基于JSP的网上招聘系统
- 下一篇:java生成二维码+jar包
相关资源
- 科大讯飞语音识别java版本demo
- 百度语音识别DEMO
- 百度语音识别android集成(eclipse)
- android开发讯飞离线命令词识别demo
- Unity 接入讯飞语音识别包(Android)
- 科大讯飞语音识别
- Android 语音发短信(语音识别-11_100)
- 讯飞语音识别android studio最简单的
- Android 实现语音识别的完整代码
- Sunflower.jar
- Android 语音唤醒(语音识别-11_101)
- Android 语音电子书(语音识别-11_099)
- Android 会聊天的机器人(语音识别-1
- Android平台使用PocketSphinx做离线语音识
- android 语音识别 合成听写 (科大讯飞
- android 语音识别
- android 语音识别可用(科大讯飞)
- 百度语音识别
- Android 语音识别
- 语音机器人(百度语音识别)
- Android根据文字语音播报、语音识别成
- Android高级应用源码-Android平台使用P
- 基于科大讯飞语音识别语音合成
- 语音识别:微信小程序开发(科大讯
- Android 语音识别 (语音转文字)
- Android 语音打电话(语音识别-11_098)
- 语音识别转文字(基于科大讯飞)
- android 语音识别转文字
评论
共有 条评论