THINKPHP 中文分词处理类

浏览:12946 最后更新:2016-11-07 15:57 分类:类库 关键字: 分词 中文分词 thinkphp
将军今天继续分享一款中文分词类库,无需其他扩展组件支持,这个类库基本能满足日常的分词,当然更精准的分词那你还是老老实实去研究分词算法和相关扩展吧。这个类库最重要一点,就是支持中文分词。

废话不多说,来说说如何使用。

首先下载类库压缩包,解压缩。里面只有两个文件,一个是dict.csv,即分词字典。一个是SplitWord.class.php,这个是分词的类库文件。将两个文件同时复制到核心扩展ORG目录或者项目的ORG目录.确保两个文件在同一目录下。

第二步,在action里编写代码如下:   public function index()
{
      //导入类库
      import("ORG.SplitWord");
      //记录下时间,调试下花了多少时间
       G('run');
      $str = "我爸是李刚你妈是梦鸽";
      //丫的,开始分词啦
      $sp = new SplitWord();
      echo $sp->SplitRMM($str) . "<hr />";
       //析放资源
       $sp->Clear();
      //打印耗时
     echo '分词完成,耗时:'.G('run','end').'s';
}
第三步: 测试下呗 ~~ enjoy it!

unpacked By 将军 2013-07-29 03:45:53
评论( 相关
后面还有条评论,点击查看>>