热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)

***版权声明:本文为博主原创文章,转载请注明本文地址。http:www.cnblogs.como0Iris0op5813856.html***内容介绍:真分布式SolrCloud

***版权声明:本文为博主原创文章,转载请注明本文地址。http://www.cnblogs.com/o0Iris0o/p/5813856.html ***

内容介绍:

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)[本文内容]

1.搭建单机solr 2.搭建zookeeper 3.配置solrcloud

**真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(2)

**

4.创建core和collection分片 5.配置IK Analyzer中文分词 5.索引mysql 6.整合web项目(web中单机solr以及solrcloud的使用)


1.运行环境

基本环境:Mac OS X

虚拟机软件:Parallels Desktop

其他环境:ubuntu14+jdk-1.7+solr-4.10.3+zookeeper-3.4.8+tomcat-7.0.70

三台ubuntu虚拟机:

192.168.1.1 master

192.168.1.2 tom

192.168.1.3 harry


2.solr单机的搭建


(单机solr先在一台虚拟机上配置即可,后期配置solrcloud之后再复制到所有虚拟机)

1.将apache-tomcat-7.0.70.tar.gz解压到/opt/tomcat/下

由于opt下的操作需要root权限,因此需要命令行,我的操作是先解压到桌面,在opt目录下创建tomcat文件夹再将解压后文件移动到/opt/tomcat/

2.将solr-4.10.3安装压缩包解压,复制解压文件夹中example/webapps中的solr.war解压移动到tomcat的webapps中

即solr.war解压后是一个完整的web项目,这样做是为了将solr的这个web项目部署到tomcat服务器上

3.拷贝解压后的solr-4.10.3文件夹中/example/lib/ext//下的jar文件到/opt/tomcat/apache-tomcat-7.0.70/webapps/solr/WEB-INF/lib/

4.拷贝解压后的solr-4.10.3文件夹中/example/resources/log4j.properties文件到tomcat/webapps/solr/WEB-INF/classes下

如果没有classes文件夹就新建一个名为classes的文件夹

5.创建solrhome文件夹,并将solr-4.10.3/example/solr中的数据拷贝到建立的solrhome文件夹中

solrhome是部署在此tomcat的单机solr的配置文件,当后面solrcloud基于zookeeper的集群搭建起来之后,会统一管理配置文件,即solrhome中的配置文件会上传到zookeeper管理的solrcloud中作为solr的配置文件


**

**

6.编辑webapps/solr/WEB-INF/web.xml文件,指定solrhome



solr/home

/opt/tomcat/apache-tomcat-7.0.70/webapps/solrhome

java.lang.String



7.重启tomcat,在浏览器输入地址http://localhost:8080/solr/

这个时候还只是单机solr,没有cloud那一栏,这个界面成功显示代表着单机solr搭建成功

有了成功的单机solr,在此基础上以继续搭建solrcloud集群



3.Zookeeper完全分布式的搭建

注意!一定不要去掉或者注释掉etc/hosts文件下的“ 127.0.0.1 localhost ”,不然会出异常,导致zookeeper不好使!

好早以前配hadoop集群的时候按照一篇教程注释掉了localhost结果竟然导致zookeeper不好使!T_T。。。这问题藏的够深

1.更改配置文件etc/hosts

etc/hosts文件内容:(注:更改此文件需要root权限,所以使用vim或者gedit更改不要忘记sudo哦)

127.0.0.1 localhost

192.168.1.230 master

192.168.1.231 tom

192.168.1.232 harry

2.创建目录/opt/zookeeper/svr和/opt/zookeeper/data/zookeeper-data,将zookeeper-3.4.8.tar.gz解压到/opt/zookeeper/svr下

3.进入conf文件夹,把zoo_sample.cfg改名为zoo.cfg并修改配置文件conf/zoo.cfg:


conf/zoo.cfg文件内容:

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/opt/zookeeper/data/zookeeper-data

dataLogDir=/opt/zookeeper/data/zookeeper-data/logs
server.1=master:2888:3888

server.2=tom:2888:3888

server.3=harry:2888:3888
clientPort=2181

参数说明:



①tickTime:心跳时间,毫秒为单位。

②initLimit: 这个配置项是用来配置 Zookeeper 接受客户端(这里客户端不是用户连接 Zookeeper服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 10*2000=20 秒。

③syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime时间长度,总时间长度就是 5*2000=10 秒。

④dataDir:存储内存中数据库快照的位置。

⑤clientPort:监听客户端连接的端口

⑥server.N= HostNameOrIP:Port1:Port2 :其中 N 是一个数字,表示这个是第几号服务器;HostNameOrIP是这个服务器的 ip 地址或者etc/hosts中中已有的主机名;Port1 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;Port2 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于HostNameOrIP都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。

**4.将zookeeper复制到剩余两台虚拟机的相同文件夹里

**

5.dataDir即/opt/zookeeper/data/zookeeper-data目录下创建myid文件,将内容设置为上⑥中N值,用来标识不同的服务器

在节点配置的dataDir指定的目录下面,创建一个myid文件,里面内容为一个数字

master中/opt/zookeeper/data/zookeeper-data文件夹下myid的内容为1,tom中myid的内容为2,harry中myid的内容为3

**

**

到此zookeeper配置完成~

6.启动ZooKeeper集群

分别进入三台虚拟机的/opt/zookeeper/svr/zookeeper-3.4.8/bin目录输入命令 ./zkServer.sh start启动集群**

**

[email protected]:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start

[email protected]:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start

[email protected]:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start

./zkServer.sh status命令查看状态,正常情况下

[email protected]:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh status

JMX enabled by default

Using config: /opt/zookeeper/svr/zookeeper-3.4.8/bin/../conf/zoo.cfg

Mode: follower

注:一开始只启动一台主机还没有启动其它两台的时候日志中会出现异常,没关系,等到三台虚拟机的zookeeper都启动了之后就一切正常了~但如果这时候输入./zkServer.sh status命令仍然如下面的状态说明启动失败

[email protected]:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /opt/zookeeper/svr/zookeeper-3.4.8/bin/../conf/zoo.cfg

Error contacting service. It is probably not running.

连接失败原因分析:

上面提到的注释掉了localhost会导致这种情况,2181端口被占用(更改zoo.cfg中端口号即可)或zoo.cfg配置文件没有正确配置(如:myid没有更改对、IP地址没有配置正确、网络连接掉线等)也会导致这种情况的出现。

如果连接失败想查询具体异常原因,可以查看/opt/zookeeper/svr/zookeeper-3.4.8/bin/zookeeper.out文件具体查看异常信息


另:jps查看进程:QuorumPeerMain是zookeeper进程

zookeeper常用命令:

启动:

./zkServer.sh start

查看状态:

./zkServer.sh status

停止:

./zkServer.sh stop

重启:

./zkServer.sh restart

连接服务器

./zkCli.sh -server HostNameOrIP:2181


3.SolrCloud配置


(注意将下面配置中的master、tom、harry更改成自己的主机名或IP地址,文件夹地址对应修改成相应的文件夹哦~)

1.solrcloud文件夹准备,solrcloud文件夹储存的是打算上传到zookeeper中统一管理的solr配置文件

创建solrcloud文件夹,可以在自己喜欢的位置,我的是/opt/tomcat/solrcloud

在solrcloud文件夹下创建solr-lib目录和config-files目录,即/opt/tomcat/solrcloud/solr-lib和/opt/tomcat/solrcloud/config-files

把 solr/WEB-INF/lib下的所有 jar包拷贝到/opt/tomcat/solrcloud/solr-lib目录

把solr/example/solr/collection1/conf下的所有文件拷贝到/opt/tomcat/solrcloud/config-files目录

2.把solrhome中的配置文件上传到zookeeper集群

java -classpath .:/opt/tomcat/solrcloud/solr-lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost master:2181,tom:2181,harry:2181 -confdir /opt/tomcat/solrcloud/config-files/ -confname myconf

3.指定collection1使用myconf配置

java -classpath .:/opt/tomcat/solrcloud/solr-lib/* org.apache.solr.cloud.ZkCLI -cmd linkconfig -collection collection1 -confname myconf -zkhost master:2181,tom:2181,harry:2181

4.更改tomcat配置文件catalina.sh

/opt/tomcat/apache-tomcat-7.0.70/bin/catalina.sh文件在第一行增加:

JAVA_OPTS="-DzkHost=master:2181,tom:2181,harry:2181"

5.更改solr.xml配置文件

注意:不要在其它系统创建更改之后再上传到虚拟机,因为solr.xml文件在solrcloud分片等操作时会被更改,如果在其它系统创建更改后上传系统权限不足或文件格式不对会导致系统无法对此文件进行操作,造成无法分片无法创建core等。

/opt/tomcat/apache-tomcat-7.0.70/webapps/solrhome/solr.xml文件内容如下:












6.此处基本的solrcloud集群就搭建配置完毕,将配置好的包括solr项目的tomcat分别复制到其它两台虚拟机

首先启动zookeeper再启动tomcat,进入浏览器输入solr项目部署地址,出现如下界面则搭建成功(比单机版多了个cloud)

**

**


真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)的相关教程结束。



推荐阅读
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • 本文介绍了在Web应用系统中,数据库性能是导致系统性能瓶颈最主要的原因之一,尤其是在大规模系统中,数据库集群已经成为必备的配置之一。文章详细介绍了主从数据库架构的好处和实验环境的搭建方法,包括主数据库的配置文件修改和设置需要同步的数据库等内容。MySQL的主从复制功能在国内外大型网站架构体系中被广泛采用,本文总结了作者在实际的Web项目中的实践经验。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 本文介绍了如何使用C#制作Java+Mysql+Tomcat环境安装程序,实现一键式安装。通过将JDK、Mysql、Tomcat三者制作成一个安装包,解决了客户在安装软件时的复杂配置和繁琐问题,便于管理软件版本和系统集成。具体步骤包括配置JDK环境变量和安装Mysql服务,其中使用了MySQL Server 5.5社区版和my.ini文件。安装方法为通过命令行将目录转到mysql的bin目录下,执行mysqld --install MySQL5命令。 ... [详细]
  • 31.项目部署
    目录1一些概念1.1项目部署1.2WSGI1.3uWSGI1.4Nginx2安装环境与迁移项目2.1项目内容2.2项目配置2.2.1DEBUG2.2.2STAT ... [详细]
  • MySQL语句大全:创建、授权、查询、修改等【MySQL】的使用方法详解
    本文详细介绍了MySQL语句的使用方法,包括创建用户、授权、查询、修改等操作。通过连接MySQL数据库,可以使用命令创建用户,并指定该用户在哪个主机上可以登录。同时,还可以设置用户的登录密码。通过本文,您可以全面了解MySQL语句的使用方法。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • Servlet多用户登录时HttpSession会话信息覆盖问题的解决方案
    本文讨论了在Servlet多用户登录时可能出现的HttpSession会话信息覆盖问题,并提供了解决方案。通过分析JSESSIONID的作用机制和编码方式,我们可以得出每个HttpSession对象都是通过客户端发送的唯一JSESSIONID来识别的,因此无需担心会话信息被覆盖的问题。需要注意的是,本文讨论的是多个客户端级别上的多用户登录,而非同一个浏览器级别上的多用户登录。 ... [详细]
  • 本文介绍了在sqoop1.4.*版本中,如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件,并重新编译,可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码,重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]
  • SpringMVC工作流程概述
    SpringMVC工作流程概述 ... [详细]
  • 面试经验分享:华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试
    最近有朋友去华为面试,面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败,因为缺乏基础知识。面试问题涉及 ... [详细]
  • Tomcat安装与配置教程及常见问题解决方法
    本文介绍了Tomcat的安装与配置教程,包括jdk版本的选择、域名解析、war文件的部署和访问、常见问题的解决方法等。其中涉及到的问题包括403问题、数据库连接问题、1130错误、2003错误、Java Runtime版本不兼容问题以及502错误等。最后还提到了项目的前后端连接代码的配置。通过本文的指导,读者可以顺利完成Tomcat的安装与配置,并解决常见的问题。 ... [详细]
author-avatar
Laiio120669
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有