词义相似度
百度 官方文档
用于计算两个给定词语的语义相似度,基于自然语言中的分布假设,即越是经常共同出现的词之间的相似度越高。词义相似度是自然语言处理中的重要基础技术,是专名挖掘、query改写、词性标注等常用技术的基础之一
基本说明:
接口地址:https://aip.baidubce.com/rpc/2.0/nlp/v2/word_emb_sim
返回格式:json
请求方式:post
请求示例:https://aip.baidubce.com/rpc/2.0/nlp/v2/word_emb_sim?charset=UTF-8&access_token=test
请求参数说明:
名称 类型 必填 说明
word_1 string 必填 词1(GBK编码),最大64字节
word_2 string 必填 词2(GBK编码),最大64字节
返回参数说明:
名称 类型 说明
log_id uint64 请求唯一标识码,随机数
score float 相似度结果,(0,1],分数越高说明相似度越高
JSON返回示例:
{
	"score": 0.456862,
	"words": {
		"word_1": "北京",
		"word_2": "上海"
	}
}
服务级错误码参照
错误码 说明
1 服务器内部错误,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
2 服务暂不可用,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
3 调用的API不存在,请检查后重新尝试
4 集群超限额
6 无权限访问该用户数据
17 每天请求量超限额
18 QPS超限额
19 请求总量超限额
100 包含了无效或错误参数,请检查代码
110 Access Token失效
111 Access token过期
282000 服务器内部错误,请再次请求, 如果持续出现此类错误,请通过QQ群(632426386)或工单联系技术支持团队。
282002 编码错误,请使用GBK编码
282004 请求中包含非法参数,请检查后重新尝试
282008 仅支持GBK和UTF-8,其余为不支持的字符编码,请检查后重新尝试
282130 当前查询无结果返回,出现此问题的原因一般为:参数配置存在问题,请检查后重新尝试
282131 输入长度超限,请查看文档说明
282133 接口参数缺失
282134 输入为空
282300 word不在算法词典中
282301 word_1提交的词汇暂未收录,无法比对相似度
282302 word_2提交的词汇暂未收录,无法比对相似度
282303 word_1和word_2暂未收录,无法比对相似度
完整教学代码示例
小F正在拼命添加中...