热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

帝国cms怎么采集信息

CMS教程|帝国CMS帝国cmsCMS教程-帝国CMS书法源码,vscode用php输出,ubuntuapt作用,tomcat没日志,sqlite3和sql,discuz插件数据库

CMS教程|帝国CMS帝国cms怎么采集信息
帝国cms
CMS教程-帝国CMS
书法 源码,vscode用php输出,ubuntu apt作用,tomcat没日志,sqlite3和sql,discuz插件数据库操作,现在网站前端用什么框架,python爬虫容易出现的错误,php开发公司的,seo学习培训引流,asp资源下载网站,网页弹出 app 下载样式,网页表单模板lzw
免费开源码,ubuntu 正在运行,用单元测试代替tomcat,物流管理爬虫,php中each返回结果是,唐山推广seolzw
帝国cms怎么采集信息?
在线表白网页源码下载,vscode文件主题,ubuntu卡死怎么关闭,tomcat 异常 退出,sqlite 数据源,jquery插件内容轮播插件,怎么测试前端框架性能,如何制作网络爬虫,php is int,竞价排名与seo,织梦网站仿魔客吧模板,网页开源框架,模板网站有动态效果,腾讯qq在线状态代码生成页面,php档案管理系统,易语言 易语言程序lzw
帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。

A、增加采集节点

1、添加节点:

帝国cms怎么采集信息

2、选择要增加采集的栏目:

帝国cms怎么采集信息

3、进入增加节点表单:

帝国cms怎么采集信息

4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:

帝国cms怎么采集信息

5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀…”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:

帝国cms怎么采集信息

6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:

帝国cms怎么采集信息

7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:

帝国cms怎么采集信息

8、切换到Dreamweaver代码方式,

就是信息链接区域:

帝国cms怎么采集信息

9、得到信息链接区域正则:

帝国cms怎么采集信息

10、得到信息页链接正则:

帝国cms怎么采集信息

11、注意:如果信息页链接是相对地址,例如,那么“内容页地址前缀”要加域名:

帝国cms怎么采集信息

12、现在要采集内容页的标题和内容:

帝国cms怎么采集信息

13、查看新闻页“源文件”,找title标签:

帝国cms怎么采集信息

14、取得标题正则:

帝国cms怎么采集信息

15、这里是要采集的内容区域:

帝国cms怎么采集信息

16、取得新闻内容正则:

帝国cms怎么采集信息

(注意:新闻内容正则里的 d_id=’*’ 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。)

17、点击提交按钮就完成了整个采集节点:

帝国cms怎么采集信息

B、预览采集节点是否正确

1、提交按钮后返回管理节点:

帝国cms怎么采集信息

2、点击“预览”采集,进入节点预览结果:

帝国cms怎么采集信息

3、采集内容页列表:

帝国cms怎么采集信息

4、采集内容页页面:

帝国cms怎么采集信息

C、采集

1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:

帝国cms怎么采集信息

2、系统正在采集中:

帝国cms怎么采集信息

3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:

帝国cms怎么采集信息

4、修改信息页面如图:

帝国cms怎么采集信息

5、对采集的信息进行审核并入库,点击“入库全部信息按钮”:

帝国cms怎么采集信息

6、确定操作:

帝国cms怎么采集信息

7、信息入库完毕提示:

帝国cms怎么采集信息

信息入库完毕后下来点击”管理信息“:

帝国cms怎么采集信息

我们可以看到刚刚采集入库的新闻信息:

帝国cms怎么采集信息

最后到“数据更新”刷新首页、栏目、和内容页就可以完成网站的信息采集了。


推荐阅读
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • PHP函数实现分页含文本分页和数字分页【PHP】
    后端开发|php教程PHP,分页后端开发-php教程最近,在项目中要用到分页。分页功能是经常使用的一个功能,所以,对其以函数形式进行了封装。影视网源码带充值系统,vscode配置根 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例
    本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤,可以获取到网站首页的新闻数据。代码示例使用Python编写,并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]
  • 本文介绍了sqlserver云存储和本地存储的区别,云存储是将数据存储在网络上,方便查看和调用;本地存储是将数据存储在电脑磁盘上,只能在存储的电脑上查看。同时提供了几种启动sqlserver的方法。此外,还介绍了如何导出数据库的步骤和工具。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 本文整理了315道Python基础题目及答案,帮助读者检验学习成果。文章介绍了学习Python的途径、Python与其他编程语言的对比、解释型和编译型编程语言的简述、Python解释器的种类和特点、位和字节的关系、以及至少5个PEP8规范。对于想要检验自己学习成果的读者,这些题目将是一个不错的选择。请注意,答案在视频中,本文不提供答案。 ... [详细]
  • Jquery 跨域问题
    为什么80%的码农都做不了架构师?JQuery1.2后getJSON方法支持跨域读取json数据,原理是利用一个叫做jsonp的概念。当然 ... [详细]
  • mui框架offcanvas侧滑超出部分隐藏无法滚动如何解决
    web前端|js教程off-canvas,部分,超出web前端-js教程mui框架中off-canvas侧滑的一个缺点就是无法出现滚动条,因为它主要用途是设置类似于qq界面的那种格 ... [详细]
  • Linux下部署Symfoy2对app/cache和app/logs目录的权限设置,symfoy2logs
    php教程|php手册xml文件php教程-php手册Linux下部署Symfoy2对appcache和applogs目录的权限设置,symfoy2logs黑色记事本源码,vsco ... [详细]
  • Oracle 和 mysql的9点区别【MySQL】
    数据库|mysql教程oracle,Oracle,money,mysql,coun数据库-mysql教程1.组函数用法规则mysql中组函数在select语句中可以随意使用,但在o ... [详细]
  • 开发笔记:Python之路第一篇:初识Python
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python之路第一篇:初识Python相关的知识,希望对你有一定的参考价值。Python简介& ... [详细]
author-avatar
111wen_292
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有