词向量表示
百度 官方文档
词向量计算是通过训练的方法,将语言词表中的词映射成一个长度固定的向量。词表中所有的词向量构成一个向量空间,每一个词都是这个词向量空间中的一个点,利用这种方法,实现文本的可计算
基本说明:
接口地址:https://aip.baidubce.com/rpc/2.0/nlp/v2/word_emb_vec
返回格式:json
请求方式:post
请求示例:https://aip.baidubce.com/rpc/2.0/nlp/v2/word_emb_vec?charset=UTF-8&access_token=test
请求参数说明:
名称 类型 必填 说明
word string 必填 文本内容(GBK编码),最大64字节
dem int 选填 词向量维度。默认值为0(对应1024维),目前仅支持dem=0
返回参数说明:
名称 类型 说明
log_id uint64 请求唯一标识码
word string 查询词
vec float 词向量结果表示
JSON返回示例:
{
	"word": "张飞",
	"vec": [
		0.233962,
		0.336867,
		0.187044,
		0.565261,
		0.191568,
		0.450725,
		0.43869, -0.448038,
		0.283711, -0.233656,
		0.555556
	]
}
服务级错误码参照
错误码 说明
1 服务器内部错误,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
2 服务暂不可用,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
3 调用的API不存在,请检查后重新尝试
4 集群超限额
6 无权限访问该用户数据
17 每天请求量超限额
18 QPS超限额
19 请求总量超限额
100 包含了无效或错误参数,请检查代码
110 Access Token失效
111 Access token过期
282000 服务器内部错误,请再次请求, 如果持续出现此类错误,请通过QQ群(632426386)或工单联系技术支持团队。
282002 编码错误,请使用GBK编码
282004 请求中包含非法参数,请检查后重新尝试
282008 仅支持GBK和UTF-8,其余为不支持的字符编码,请检查后重新尝试
282130 当前查询无结果返回,出现此问题的原因一般为:参数配置存在问题,请检查后重新尝试
282131 输入长度超限,请查看文档说明
282133 接口参数缺失
282134 输入为空
282300 word不在算法词典中
282301 word_1提交的词汇暂未收录,无法比对相似度
282302 word_2提交的词汇暂未收录,无法比对相似度
282303 word_1和word_2暂未收录,无法比对相似度
完整教学代码示例
小F正在拼命添加中...