TP3.1.3中文分词

浏览:2671 发布日期:2014/02/13 分类:功能实现 关键字: 中文分词 乱码
TP3.1.3中文分词
http://www.thinkphp.cn/extend/435.html
分词类是使用上面的处理类
我的页是使用的是utf-8, 有些词分出是乱码.
我是这样处理的
Vendor ( 'SplitWord\lib_splitword_full' );
$sp = new SplitWord ();
$temp_str = $sp->SplitRMM ( trim ( $val ) );
$sp->Clear ();
if (mb_detect_encoding ( $temp_str, array (
'ASCII',
'UTF-8',
'GB2312',
'GBK',
'BIG5'
) ) !== 'UTF-8') {
$temp_str = iconv ( 'gbk', 'utf-8', $temp_str );
}

附件 SplitWord.rar ( 660.26 KB 下载:241 次 )

评论( 相关
后面还有条评论,点击查看>>