热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【Python笔记】python第三方库lxml源码安装&&使用笔记

python第三方库lxml使用笔记1.源码安装    由于想折腾一下,故选择源码安装。    从官网下载lxml最新版本(lxml-3.3.3)源码,linux机器可用curl工

python第三方库lxml使用笔记

1. 源码安装
        由于想折腾一下,故选择源码安装。
        从官网下载lxml最新版本(lxml-3.3.3)源码,linux机器可用curl工具拉取lxml源码,参考命令如下

curl -v --cacert ./https-ca/cacert.pem https://pypi.python.org/packages/source/l/lxml/lxml-3.3.3.tar.gz#md5=f2675837b4358a5ecab5fd9a783fd0e5 -o lxml-3.3.3.tar.gz

        其中:–cacert ./https-ca/cacert.pem指定我机器上https认证文件的全路径,其它机器则该路径需要修改。关于认证文件的获取方法,可参考我之前写的这篇笔记。

        下载完成后解压,由INSTALL.txt可知,这货安装前需要预先装好libxml2和libxslt两个包,于是继续折腾:从xmlsoft.org官网下载libxml2和libxslt的最新版源码后分别解压安装。

        安装时的注意事项:

        a. 先装libxml2,后装libxslt,否则安装libxslt时报错

        b. 执行./configure时,可通过参数–with-python=[DIR]指定自己想bind的python全路径(在多人共用的机器上很有必要指定)

        c. make libxslt源码前,需通过./configure中指定python全路径及libxml2的3个参数,参考命令如下:

/configure --prefix=/home/slvher/tools/3rd-libs-for-py/libxslt-1.1.28/ --with-python=/home/slvher/tools/python-2.7.5/bin/python --with-libxml-prefix=/home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0 --with-libxml-include-prefix=/home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0/include/ --with-libxml-libs-prefix=/home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0/lib/

        libxml2和libxslt安装成功后,进入lxml源码目录,在某临时目录(假设为/home/slvher/tools/lxml-package)下安装lxml,参考命令如下:

python ./setup.py install root=/home/slvher/tools/lxml-package --with-xml2-cOnfig=/home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0/bin/xml2-config --with-xslt-cOnfig=/home/slvher/tools/3rd-libs-for-py/libxslt-1.1.28/bin/xslt-config

        将该临时安装目录下lxml和lxml-3.3.3-py2.7.egg-info两个文件夹cp至python安装目录的site-packages路径下,至此,lxml安装完成

        个人体会:如果机器系统有现成的包管理工具或easy_install之类的工具支持一键安装,并且自己不想折腾,建议不要通过源码安装,对于老手来说,这个过程实在是有点浪费时间 -_-

2. 测试是否可用
        lxml及其egg-info拷贝到python的site-packages目录后,可以在python中试用lxml:

>>> from lxml import etree
Traceback (most recent call last):
File "", line 1, in
ImportError: /home/slvher/tools/python-2.7.5/lib/python2.7/site-packages/lxml/etree.so: undefined symbol: exsltStrXpathCtxtRegister

        符号找不到,难道是安装有问题?

        进入python的site-packages目录,终端输入命令ldd lxml/etree.so,输出结果如下:

lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
lxml/etree.so: /usr/lib64/libxslt.so.1: no version information available (required by lxml/etree.so)
libxslt.so.1 => /usr/lib64/libxslt.so.1 (0x00007fd95d51f000)
libexslt.so.0 => /usr/lib64/libexslt.so.0 (0x00007fd95d40e000)
libxml2.so.2 => /home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0/lib/libxml2.so.2 (0x00007fd95d1c2000)
libz.so.1 => /usr/lib64/libz.so.1 (0x00007fd95d0ae000)
libm.so.6 => /lib64/tls/libm.so.6 (0x00007fd95cf28000)
libpthread.so.0 => /lib64/tls/libpthread.so.0 (0x00007fd95ce13000)
libc.so.6 => /lib64/tls/libc.so.6 (0x00007fd95cbde000)
libgcrypt.so.11 => /usr/lib64/libgcrypt.so.11 (0x00007fd95ca94000)
libgpg-error.so.0 => /usr/lib64/libgpg-error.so.0 (0x00007fd95c991000)
libdl.so.2 => /lib64/libdl.so.2 (0x00007fd95c88d000)
/lib64/ld-linux-x86-64.so.2 (0x000000302ad00000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x00007fd95c776000)

        可见,etree.so中依赖的libxslt.so.1和libexslt.so.0指向了机器/usr/lib64/路径下老版本的so库

       
解决办法如下:

export LD_LIBRARY_PATH=/home/slvher/tools/3rd-libs-for-py/libxml2-2.9.0/lib/:/home/slvher/tools/3rd-libs-for-py/libxslt-1.1.28/lib/:$LD_LIBRARY_PATH

        然后在python终端执行from lxml import etree

        一切正常

       
提示:

        若想在其它机器上使用lxml又不想安装,则可以将已装有lxml包的python的site-packages目录中与lxml有关的2个文件夹拷贝至目标机器python的site-packages目录下,然后将etree依赖的3个so库拷贝至目标机器的某指定路径下,最后通过LD_LIBRARY_PATH将该路径包含至python包对so的搜索路径中即可。

【参考资料】
1. lxml官网文档

========================== EOF ==========================


推荐阅读
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 本文介绍了在Linux下安装Perl的步骤,并提供了一个简单的Perl程序示例。同时,还展示了运行该程序的结果。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • 本文介绍了5个基本Linux命令行工具的现代化替代品,包括du、top和ncdu。这些替代品在功能上进行了改进,提高了可用性,并且适用于现代化系统。其中,ncdu是du的替代品,它提供了与du类似的结果,但在一个基于curses的交互式界面中,重点关注占用磁盘空间较多的目录。 ... [详细]
  • 在加载一个第三方厂商的dll文件时,提示“找不到指定模块,加载失败”。由于缺乏必要的技术支持,百思不得期间。后来发现一个有用的工具 ... [详细]
  • 查找给定字符串的所有不同回文子字符串原文:https://www ... [详细]
  • 数据结构与算法:回溯法之全排列
    题源:46.全排列初次接触回溯法真的好难,debug了半天才了解到了其中的具体原理过程,接下来我引用weiwei哥的讲解和我自己的一些理解, ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • 本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤,并提供了相关的命令和配置示例。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 加密、解密、揭秘
    谈PHP中信息加密技术同样是一道面试答错的问题,面试官问我非对称加密算法中有哪些经典的算法?当时我愣了一下,因为我把非对称加密与单项散列加 ... [详细]
author-avatar
橄榄村
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有