Elasticsearch- 分词查询-白红宇

Elasticsearch- 分词查询

阅读量：6956 次

发布时间：2019-06-27

本文共 1564 字，大约阅读时间需要 5 分钟。

Elasticsearch- 分词查询

查看分词的命令， ES配置完成后需要测试分词，看看分词是否达到预期效果。

curl 命令查看：

1. 使用自定义的分析器查看分词：ansj_index_synonym：自定交分析器名称. pretty ：json格式显示

[plain]

curl -XGET 'http://localhost:8200/zh/_analyze?analyzer=ansj_index_synonym&pretty' -d '童装童鞋'

2. 使用自定义的分词器（tokenizer）和过滤器（filters）查看分词：

[plain]

curl -XGET 'http://localhost:8200/zh/_analyze?tokenizer=ansj_index&filters=synonym&pretty' -d '童装童鞋'

3. 查询某个字段的分词：

[plain]

curl -XGET 'http://localhost:8200/zh/_analyze?field=brand_name&pretty' -d '童装童鞋'

“brand_name”：字段名称，如果是字段是nest,object类型，也可以写成"brand_name. name"

除了自定义自己的分析器，ES自己也有内置分析器如：

standard

simple

whitespace

stop

keyword

pattern

language

snowball

custom

具体解释：

需要英文好点在同鞋。

ES还内置了分词器和过滤器：

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-tokenizers.htmlstandard

edge_ngram

keyword

letter

lowercase

ngram

whitespace

pattern

uax_email_url

path_hierarchy

ascii folding

length

lowercase

uppercase

nGram

edge_ngram

porter_stem

shingle

stop

word_delimiter

stemmer

stemmer_override

keyword_marker

keyword_repeat

kstem

snowball

phonetic

synonym

reverse

elision

truncate

unique

pattern_capture

pattern_replace

trim

limit

hunspell

common_grams

normalization

delimited_payload

keep_words

elasticsearch-analysis-mmseg

基于

elasticsearch-analysis-jieba

elasticsearch-analysis-ansj

elasticsearch-analysis-ik

elasticsearch-analysis-paoding

https://github.com/medcl/elasticsearch-analysis-paoding

中文分词推荐用ik,mmseg，这两个分词器有更新。

ansj,paoding分词器很久没更新了，没有对应比较高的es版本。

转载于:https://my.oschina.net/xiaominmin/blog/1597170

你可能感兴趣的文章

java多线程 ThreadLocal

查看>>

maven depenencies 不见了

查看>>

关于android实现拖动旋转角度，调整布局参数的思路

【产品功能】配置网卡从此与关机无缘，弹性网卡支持热插拔功能

查看>>

UWP 绑定数据源异常进入系统断点！global::System.Diagnostics.Debugger.Break();

查看>>

vue附件名字显示打印机的解决方案

查看>>

mysql用户管理常用sql语句mysql数据库备份恢复

查看>>

比特币耶稣Roger Ver：比特币现金是比特币扩容问题的答案

查看>>

mysql主从常见问题

查看>>

五周第四次课（4月23日）8.6 管道符和作业控制 8.7/8.8 shell变量 8.9 环境变量配置文件...

查看>>

10.32/10.33 rsync通过服务同步 10.34 linux系统日志 10.35 screen工具

查看>>

视频点播开发者实战：视频水印的基本使用

查看>>

用网关zuul时，熔断hytrix里面的坑

查看>>

【死磕 Spring】—– 4 张图带你读懂 Spring IOC 的世界