热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

es命令删除索引数据_SpringBoot+Cloud全家桶微服项目四分布式搜索引擎elasticsearch...

一.Elasticsearch简介Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化
一.Elasticsearch简介

Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。

它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。

Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。但是Lucene只是一个框架,要充分利用它的功能,需要使用JAVA,并且在程序中集成Lucene。需要很多的学习了解,才能明白它是如何运行的,Lucene确实非常复杂。

Elasticsearch和solr比较:

Elasticsearch优点:

可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公司;也可以运行在单机上

将全文检索、数据分析以及分布式技术,合并在了一起,才形成了独一无二的ES;

开箱即用的,部署简单

全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理

Elasticsearch缺点:开发者少

solr优点:

Solr有一个更大、更成熟的用户、开发和贡献者社区。

支持添加多种格式的索引,如:HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式。

Solr比较成熟、稳定。

不考虑建索引的同时进行搜索,速度更快。

Solr缺点:

建立索引时,搜索效率下降,实时索引搜索效率不高。

Elasticsearch的特点:

(1)可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公

司;也可以运行在单机上

(2)将全文检索、数据分析以及分布式技术,合并在了一起,才形成了独一无二的ES;

(3)开箱即用的,部署简单

(4)全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理

Elasticearch的体系结构:

索引(index)

Elasticsearch里的索引概念是名词而不是动词,在elasticsearch里它支持多个索引。有点类似于关系数据库里面每一个服务器可以支持多个数据库是一个道理,在每一索引下面又可以支持多种类型,这又类似于关系数据库里面的一个数据库可以有多张表一样。但是本质上和关系数据库还是有很大的区别,我们这里暂时可以这么理解。

映射(mapping)

在有关全文搜索基础知识部分,我们提到了分析的过程:为建索引和搜索准备输入文本

文档类型(type)

在Elasticsearch中,一个索引对象可以存储很多不同用途的对象。例如,一个博客应用程序

可以保存文章和评论。文档类型让我们轻易地区分单个索引中的不同对象

文档(document)

存储在Elasticsearch中的主要实体叫文档(document)。用关系型数据库来类比的话,一个文

档相当于数据库表中的一行记录。

863722de40ba5c0db1aee8f733e5201b.png
二.Head插件的安装与使用

1.执行命令创建head

docker run -di --name=tensquareEshead -p 9100:9100 mobz/elasticsearch-head:5

2.出现的问题,启动后无法连接es服务器,我们没有设置es的配置文件,设置跨域访问

如何的解决问题的:进入容器内部

docker exec -it tensquareES /bin/bash

执行命令apt-get update

执行命令安装: apt-get install -y vim 安装vim

进入es的目录下conf配置文件目录打开 elasticsearch.yml配置文件中增加以下配置,添加如下

http.cors.enabled: true #允许跨域访问

http.cors.allow-origin: "*" #指定允许访问的ip,*代表所有ip均可访问

重新启动容器后测试

三.IK分词器的使用

windows环境下安装:

1、找到资料中ik分词器压缩包,将压缩包解压,将解压文件夹拷贝到/ES_HOME/plugins/下

2、重启ElasticSearch服务-

3、两种分词策略:ik_smart ik_max_word

4、扩展自定义字典。新建自定义词典文件 xx.dic 添加扩展词组 在ik分词器配置文件中加载

docker环境下安装:

1、将ik分词器压缩包上传到服务器、解压、重命名 mv

2、目标:宿主机跟容器进行文件拷贝

**在宿主机执行命令:docker cp 源文件 目标文件夹

**进入容器获取es存放插件目录:1a4bf55d4c9d:/usr/share/elasticsearch/plugins

注意出现问题: 无法安装vim命令

如何解决: 用docker cp 源 目的 这个命令docker 的拷贝命令

可以从容器拷贝到宿主机

也可以从宿主机拷贝到容器

就是注意两个目的源的位置

3aa7ac37d605:/usr/share/elasticsearch/config

3aa7ac37d605:/usr/share/elasticsearch/plugins

最小切分:

http://192.168.72.135:9200/_analyze?analyzer=ik_smart&pretty=true&text=%E6%88%91%E6%98%AF%E7%A8%8B%E5%BA%8F%E5%91%98

最大切分:

http://192.168.72.135:9200/_analyze?analyzer=ik_max_word&pretty=true&text=%E6%88%91%E6%98%AF%E7%A8%8B%E5%BA%8F%E5%91%98

elasticsearch和solr的搜索比较:

https://www.cnblogs.com/chowmin/articles/4629220.html

四.搜索微服务的开发

需求分析:完成首页的搜索功能,可以通过标题或者内容进行进行搜索

1824460695efb64cdc0264116340be91.png

创建项目tensquare_search

36839fc16aa8844d6a51dbc3d519a7e4.png

编写启动类

1c6f1c446237bab4898d893057cf18db.png

​pojo编写

@Document(indexName = "tensquare



推荐阅读
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 项目运行环境配置及可行性分析
    本文介绍了项目运行环境配置的要求,包括Jdk1.8、Tomcat7.0、Mysql、HBuilderX等工具的使用。同时对项目的技术可行性、操作可行性、经济可行性、时间可行性和法律可行性进行了分析。通过对数据库的设计和功能模块的设计,确保系统的完整性和安全性。在系统登录、系统功能模块、管理员功能模块等方面进行了详细的介绍和展示。最后提供了JAVA毕设帮助、指导、源码分享和调试部署的服务。 ... [详细]
  • camel_使用Camel在来自不同来源的Solr中索引数据
    camelApacheSolr是建立在Lucene之上的“流行的,快速的开源企业搜索平台”。为了进行搜索(并查找结果),通常需要从不同的源(例如内容管理 ... [详细]
  • es的分布式原理?es是如何实现分布式的?
    Elasticsearch设计的理念是分布式搜索引擎,底层其实是基于lucene。核心思 ... [详细]
  • 一:什么是solrSolr是apache下的一个开源项目,使用Java基于lucene开发的全文搜索服务器;Lucene是一个开放源代 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • Activiti7流程定义开发笔记
    本文介绍了Activiti7流程定义的开发笔记,包括流程定义的概念、使用activiti-explorer和activiti-eclipse-designer进行建模的方式,以及生成流程图的方法。还介绍了流程定义部署的概念和步骤,包括将bpmn和png文件添加部署到activiti数据库中的方法,以及使用ZIP包进行部署的方式。同时还提到了activiti.cfg.xml文件的作用。 ... [详细]
  • 目录浏览漏洞与目录遍历漏洞的危害及修复方法
    本文讨论了目录浏览漏洞与目录遍历漏洞的危害,包括网站结构暴露、隐秘文件访问等。同时介绍了检测方法,如使用漏洞扫描器和搜索关键词。最后提供了针对常见中间件的修复方式,包括关闭目录浏览功能。对于保护网站安全具有一定的参考价值。 ... [详细]
  • 本文总结了初学者在使用dubbo设计架构过程中遇到的问题,并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题,初学者能够更好地理解和应用dubbo设计架构。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 1.0为什么要做这个博客站?  在工作学习中,经常要搜索查找各种各样的资料,每次找到相关资料后都会顺手添加到浏览器书签中,时间一长,书签也就满了。而且下次再点击这个书签时,可能就会忘记当时为什么要添加这个书签了,更有可能书签连接已经无效。这样一来,也就不方便 ... [详细]
author-avatar
伊华Zhu
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有