菠菜园公共API免费开放，持续更新 - 第3页

六、身份证识别

身份证识别接口可以快速的帮您获取身份证中的信息，而无需手动录入。

接口地址：http://api.zkii.net/idocr.php

请求参数：side参数有两个值，front(正面)和back(反面)。在网上有些人说身份证的正面是带国徽的，但是在这个接口中正面就是人像，有身份证号码的一面，所以不用考虑那么多。其次是img参数，老样子img参数就是你的身份证正反面图片，仅支持jpg和png类型。

请求示例：（仅支持GET请求）

http://api.zkii.net/idocr.php?side=front&img=http://abc.com/images.test.jpg

正常返回示例：

{
"log_id": 2648325511,
"direction": 0,
"image_status": "normal",
"idcard_type": "normal",
"edit_tool": "Adobe Photoshop CS3 Windows",
"words_result": {
"住址": {
"location": {
"left": 267,
"top": 453,
"width": 459,
"height": 99
},
"words": "南京市江宁区弘景大道3889号"
},
"公民身份号码": {
"location": {
"left": 443,
"top": 681,
"width": 589,
"height": 45
},
"words": "330881199904173914"
},
"出生": {
"location": {
"left": 270,
"top": 355,
"width": 357,
"height": 45
},
"words": "19990417"
},
"姓名": {
"location": {
"left": 267,
"top": 176,
"width": 152,
"height": 50
},
"words": "伍云龙"
},
"性别": {
"location": {
"left": 269,
"top": 262,
"width": 33,
"height": 52
},
"words": "男"
},
"民族": {
"location": {
"left": 492,
"top": 279,
"width": 30,
"height": 37
},
"words": "汉"
}
},
"words_result_num": 6
}

返回json数据，编码方式UTF-8，注意解码，防止乱码产生。

七、图片自动裁切

图片自动裁切接口主要用于解决程序开发过程中，图片裁切时容易把图像中的重要信息部分裁切掉或裁切一半留一半的情况。该接口基于图像识别算法进行开发，能够自动识别图片中人脸和其他重要信息部分，并根据用户需要的图片大小进行智能裁切。

接口地址：http://api.zkii.net/img_cut.php

参数说明：

img:需要裁切的图片URL
w:裁切后图像的宽度
h:裁切后图像的高度

请求方法：GET

请求示例：

http://api.zkii.net/img_cut.php?img=http://pic30.nipic.com/20130606/7447430_175843144000_2.jpg&w=500&h=400

返回结果依然是标准的JSON格式，具体请参考：https://www.zkii.net/tech/php/1277.html

八、中文分词

中文分词是一个项目开发中尤其是智能化相关项目开发中经常用到的一个基础组件，菠菜园提供的接口主要基于“ICTCLAS 3.0 2009共享版中文分词算法”，该算法是中国科学院计算技术研究所在多年研究工作积累的基础上，基于多层隐马模型研制出的汉语词法分析系统，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。

在算法上菠菜园没有什么创新，菠菜园主要是在前辈们研究的基础上加入了一些其他高频词汇，丰富了部分语料库，后期菠菜园也将会把语料库的更新接口分享出来，以供不同的行业，不同的应用有针对性的去丰富。目前分词识别率只达到了90%左右，并非100%，如果您的要求比较高的话，请勿使用。

接口地址：http://api.zkii.net/swcs.php

请求方法：POST（考虑到一些大文本的需要，GET长度有限制，故只支持POST）

参数说明：

字段名称	字段说明	类型	必填	备注
data	需要分词的字符串	string	Y	-
respond	响应结果格式(其值为: php\|json\|xml)	string	N	默认：php
charset	待分词的字符串编码(gbk/utf8)	string	N	默认:utf8
ignore	是否忽略标点符号(yes/no)	string	N	默认:no
duality	是否散字自动二元(yes/no)	string	N	默认:no
traditional	是否采用繁体字库(yes/no，默认为 no)	string	N	仅当 charset 为 utf8 时有效
multi	复合分词的级别(整数值 1~15：0x01-最短词；0x02-二元；0x04-重要单字；0x08-全部单字)	string	N	默认为0，建议设置为 3

如果请求成功，那么status会返回“OK”，words值是一个排列好的数组，其中每个分词包含word（词语）、off（该词在未分词文本中的偏移位置）、idf（该词的 IDF 值）、attr（词语的词性，详见）。

如果出错，status 属性/键的值为 error，而 message 为错误信息。

更多公共api陆续开放中，敬请期待...

1 2 3

发表评论取消回复

您必须登录才能发表留言！

目前评论：5 其中：访客 3 博主 2

小哲 0
登录以回复 2017年07月29日下午4:42 沙发

虽然没什么用，不过技术还行，加油~
- 波波
  登录以回复 2017年08月06日上午9:42 1层
  
  @小哲谢谢

华时朝明 0
登录以回复 2017年11月04日下午5:18 板凳

这个聊天机器人是你自己写的么？还是用第三方的接口呢？我感觉自己写的话要准备比较大的词库啊
- 波波
  登录以回复 2017年11月06日下午9:18 1层
  
  @华时朝明多个第三方接口集成到一个接口中，根据用户输入信息进行判断处理。很简单，你也可以试试

狂放 0
登录以回复 2017年12月23日下午4:44 地板

小i。。。。。

六、身份证识别

七、图片自动裁切

八、中文分词

发表评论取消回复

目前评论：5 其中：访客 3 博主 2

微信