百分百源码网-让建站变得如此简单! 登录 注册 签到领金币!

主页 | 如何升级VIP | TAG标签

当前位置: 主页>网站教程>网页制作> 用PHP的FFI调取cjieba
分享文章到:

用PHP的FFI调取cjieba

发布时间:12/01 来源:未知 浏览: 关键词:
引荐:《PHP视频教程》

phpjieba_ffi

使用PHP 7.4的 FFI 测试直接调取cjieba分词的动态库

选用CJieba的缘由是FFI使用的是C的调取约定,假如用Cpp,还得本人包装一下,然后extern C,让编译器生成标准C的动态库。

碰到的问题

段错误

C变量没有初始化

直接调取了C的函数,没有通过FFI 初始化后的的C对象调取

非空推断 需要使用 FFI::isNull($x)

指针情势的数组 不克不及用foreach

指针情势数组的轮回

查看C代码发明Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

返回的是一个构造体指针,在C说话里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操纵来遍历,在FFI里面呢?

关于这个数组,我一开端用foreach 轮回,直接报段错误了,后来和C一样,直接用指针++,发明是可行的,这里给FFI点赞,竟然也可以直接操纵C指针。

分词结果猎取

如上面的代码,关于单个分词CJiebaWord,也不是留存的分词,而是sentence + offset,就是说第一个分词结果必定是原始字符串。

在C的demo里是printf格局化(. 表示字段宽度和对齐),但是PHP里没有相似的办法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {
    printf("%*.*s\n", x->len, x->len, x->word);
  }

用途示例

编译动态库

make libjieba.so

运转

time php demo.php

运转c demo

make demo
time ./demo

结果

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 根本都是 12%

可以发明使用FFI,PHP的速度根本和C差不多,如有CPU占用大的业务,可以尝试使用其它说话(C/C++,golang,Rust等)编写然后输出标准C的动态库。

FFI的用处

在没有FFI此前,需要系统调取或者sdk方式调取的地方,PHP就需要开发扩展,但是开发扩展不仅需要懂得C说话,还得理解PHP内核,比力艰难。 此刻就利便多了,直接使用FFI调取动态库即可。

扩展 宏展开

比方海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支撑 type define 安心使用

原文地址:https://github.com/dwdcth/phpjieba_ffi

以上就是用PHP的FFI调取cjieba的具体内容,更多请关注百分百源码网其它相关文章!

打赏

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

百分百源码网 建议打赏1~10元,土豪随意,感谢您的阅读!

共有158人阅读,期待你的评论!发表评论
昵称: 网址: 验证码: 点击我更换图片
最新评论

本文标签

广告赞助

能出一分力是一分吧!

订阅获得更多模板

本文标签

广告赞助

订阅获得更多模板