我在.net为酒精公司创建了一个网络应用程序.
客户要求拒绝对网站的所有访问权限,除非用户同意他们在其县内的年龄并且他们同意这些条款.
为了实现此功能,我只需将所有流量重定向到验证页面,在那里他们可以设置新会话,表示他们已同意(在此次访问时)这些条款.设置会话后,该站点即可完全访问.
我的问题是,我想谷歌等人抓取并索引网站上的所有页面.如何确保机器人不会被年龄验证页面捕获,这是确保我的整个网站被抓取的最佳做法.
.NET Framework的HttpWebRequest负责大部分工作.在Page_Load
您的代码隐藏文件中,您可以轻松检查爬虫:
if(Request.Browser.Crawler)
如果它的爬虫(例如GoogleBot)手动绕过年龄验证