博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Elasticsearch- 分词查询
阅读量:6956 次
发布时间:2019-06-27

本文共 1564 字,大约阅读时间需要 5 分钟。

hot3.png

Elasticsearch- 分词查询

查看分词的命令, ES配置完成后需要测试分词,看看分词是否达到预期效果。 

curl 命令查看:

1. 使用自定义的分析器查看分词:ansj_index_synonym:自定交分析器名称.  pretty :json格式显示

 

[plain] 
 
  1. curl -XGET 'http://localhost:8200/zh/_analyze?analyzer=ansj_index_synonym&pretty' -d '童装童鞋'  

 

 

2. 使用自定义的分词器(tokenizer)和过滤器(filters)查看分词:

 

[plain] 
 
  1. curl -XGET 'http://localhost:8200/zh/_analyze?tokenizer=ansj_index&filters=synonym&pretty' -d '童装童鞋'  

 

 

3. 查询某个字段的分词:

 

[plain] 
 
  1. curl -XGET 'http://localhost:8200/zh/_analyze?field=brand_name&pretty' -d '童装童鞋'  

 

 

“brand_name”:字段名称,如果是字段是nest,object类型,也可以写成"brand_name. name"

 

除了自定义自己的分析器,ES自己也有内置分析器如:

standard 

simple 
whitespace 
stop 
keyword 
pattern 
language
snowball 
custom

具体解释:

需要英文好点在同鞋。 

 

ES还内置了分词器和过滤器:

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-tokenizers.htmlstandard

edge_ngram
keyword
letter
lowercase
ngram 
whitespace 
pattern 
uax_email_url 
path_hierarchy 
ascii folding 
length 
lowercase 
uppercase 
nGram 
edge_ngram 
porter_stem 
shingle 
stop 
word_delimiter 
stemmer 
stemmer_override 
keyword_marker 
keyword_repeat 
kstem 
snowball 
phonetic 
synonym 
reverse 
elision 
truncate 
unique 
pattern_capture 
pattern_replace 
trim 
limit
hunspell 
common_grams 
normalization 
delimited_payload 
keep_words 

elasticsearch-analysis-mmseg

基于 

elasticsearch-analysis-jieba

elasticsearch-analysis-ansj

elasticsearch-analysis-ik

elasticsearch-analysis-paoding

https://github.com/medcl/elasticsearch-analysis-paoding

 

中文分词推荐用ik,mmseg,这两个分词器有更新。

ansj,paoding分词器很久没更新了,没有对应比较高的es版本。

 

转载于:https://my.oschina.net/xiaominmin/blog/1597170

你可能感兴趣的文章
java多线程 ThreadLocal
查看>>
maven depenencies 不见了
查看>>
关于android实现拖动旋转角度,调整布局参数的思路
查看>>
关于Java集合类迭代删除元素的一些坑
查看>>
注释那些事儿:前端代码质量系列文章(一)
查看>>
向代码致敬,寻找你的第83行
查看>>
【产品功能】配置网卡从此与关机无缘,弹性网卡支持热插拔功能
查看>>
UWP 绑定数据源异常 进入系统断点!global::System.Diagnostics.Debugger.Break();
查看>>
vue附件名字显示打印机的解决方案
查看>>
mysql用户管理 常用sql语句mysql数据库备份恢复
查看>>
比特币耶稣Roger Ver:比特币现金是比特币扩容问题的答案
查看>>
mysql主从常见问题
查看>>
五周第四次课(4月23日)8.6 管道符和作业控制 8.7/8.8 shell变量 8.9 环境变量配置文件...
查看>>
10.32/10.33 rsync通过服务同步 10.34 linux系统日志 10.35 screen工具
查看>>
视频点播开发者实战:视频水印的基本使用
查看>>
用网关zuul时,熔断hytrix里面的坑
查看>>
【死磕 Spring】—– 4 张图带你读懂 Spring IOC 的世界
查看>>
大数据之MySql早课9.20
查看>>
单例设计模式
查看>>
高并发的“大杀器”:异步化、并行化
查看>>