热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用Python获取沪深两市上市公司股票信息,提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票,并存入mysql数据库

1#该脚本可以提取沪深两市上市公司股票信息,并按以下信息分类:(1)当天股价创近10个交易日新高的股票;(2)停牌的股票;(3)复牌不超过一个交易日或者新发行的股票2#将分类后的股票及其信息(
 1 #该脚本可以提取沪深两市上市公司股票信息,并按以下信息分类:(1)当天股价创近10个交易日新高的股票;(2)停牌的股票;(3)复牌不超过一个交易日或者新发行的股票
2 #将分类后的股票及其信息(股价新高、当前状态等)存入mysql数据库
3 from time import *
4 import pandas as pd
5 import tushare as ts
6 from datetime import date
7 import datetime
8 import MySQLdb
9 import sys
10 reload(sys)
11 sys.setdefaultencoding('utf8') #将编码方式默认改为utf-8
12 #-------------------------------定义函数:计算当天往前推Deltadays个交易日所对应的日期--------------------------
13 def com_StartDate(Deltadays):
14 i=0
15 da=date.today()
16 while i!=Deltadays:
17 da=da-datetime.timedelta(days=1)
18 if da.isoweekday()==6 or da.isoweekday()==7: #判断当前日期是否为周末(此处未考虑法定节假日,后续改进)
19 pass
20 else:
21 i+=1
22 return da.strftime("%Y-%m-%d") #返回值数据类型为string
23
24 #--------------定义函数:判断某支股票处于什么状态,并返回股票代码、名字和股价(对于创新高的股票)等信息--------
25 def stock_info(stockID,startdate,index):
26 today=date.today()
27 df=ts.get_hist_data(stockID,start=startdate,end=today.strftime("%Y-%m-%d")) #获取股票信息
28 if type(df)!=type(None) and len(df.index)>1: #抓取时间周期内,有数据天数低于2天的,算作新股
29 df=df.reindex(index=index,method='ffill',fill_value=int(-1))
30 period_high=df['high'].max()
31 today_high=df.ix[today.strftime("%Y-%m-%d")]['high']
32 if today_high>=period_high and today_high>0 :
33 stock_status=int(0) #非新股,未停牌,股价创新高
34 return stock_status,df
35 elif today_high==int(-1):
36 stock_status=int(1) #非新股,但停牌
37 return stock_status,df
38 else:
39 stock_status=int(2) #非新股,未停牌,股价未创新高
40 return stock_status,df
41 else:
42 stock_status=int(3) #新股或复牌不超过1天的股票
43 return stock_status,df
44
45 #-----------------------------------------------获取沪深两市所有 上市公司基本信息---------------------------
46 all_stocks_info=ts.get_stock_basics()
47 Deltadays=10
48 startdate=com_StartDate(Deltadays)
49 newRecStocksID=[] #股票价格创新高的股票代码列表
50 newRecStocksPrice=[] #创新高的股票价格列表
51 newRecStocksName=[] #股票价格创新高的股票名称列表
52 suspendedStocksID=[] #停牌股票代码列表
53 suspendedStocksName=[] #停牌股票名称列表
54 newORresumeStocksID=[] #新发行或者当天复牌的股票代码列表
55 newORresumeStocksName=[] #新发行或者当天复牌的股票名称列表
56 today=date.today()
57 index=ts.get_hist_data('002625',start=startdate,end=today.strftime("%Y-%m-%d"),retry_count=10,pause=1).index
58 for i in all_stocks_info.index:
59 stock_status,stockinfo=stock_info(str(i), startdate,index)
60 if stock_status==int(0): #当日股价创Deltadays天内新高的股票
61 newRecStocksID.append(str(i).zfill(6))
62 newRecStocksName.append(all_stocks_info.ix[str(i),'name'])
63 newRecStocksPrice.append(stockinfo.ix[today.strftime("%Y-%m-%d"),'high'])
64 elif stock_status==int(1): #已停牌的股票
65 suspendedStocksID.append(str(i).zfill(6))
66 suspendedStocksName.append(all_stocks_info.ix[str(i), 'name'])
67 elif stock_status==int(2): #未停牌,且股价未创Deltadays天内新高的股票
68 pass
69 else: #该股票为新发行或者复牌不超过一天的股票
70 newORresumeStocksID.append(str(i).zfill(6))
71 newORresumeStocksName.append(all_stocks_info.ix[str(i), 'name'])
72
73 #-------------------------------------------数据写入DataFrame----------------------------------------------
74 newRecStocks=pd.DataFrame({'stockID':newRecStocksID,'stockname':newRecStocksName,'high_price':newRecStocksPrice,'status':['NewRecord']*len(newRecStocksID)})
75 suspendedStocks=pd.DataFrame({'stockID':suspendedStocksID,'stockname':suspendedStocksName,'status':['Suspended']*len(suspendedStocksID)})
76 newORresumeStocks=pd.DataFrame({'stockID':newORresumeStocksID,'stockname':newORresumeStocksName,'status':['New or Resume']*len(newORresumeStocksID)})
77
78 #-----------------------------------将数据存入MySQL数据库,数据库名称:stocks------------------------------
79 db=MySQLdb.connect('localhost','root','900417','stocks',charset='utf8')
80 pd.io.sql.to_sql(frame=newRecStocks,con=db,name=today.strftime("%Y%m%d")+'newRecordStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)
81 pd.io.sql.to_sql(frame=suspendedStocks,con=db,name=today.strftime("%Y%m%d")+'suspendedStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)
82 pd.io.sql.to_sql(frame=newORresumeStocks,con=db,name=today.strftime("%Y%m%d")+'newORresumeStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)
83 db.commit()
84 db.close()

 

  












推荐阅读
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文讨论了如何优化解决hdu 1003 java题目的动态规划方法,通过分析加法规则和最大和的性质,提出了一种优化的思路。具体方法是,当从1加到n为负时,即sum(1,n)sum(n,s),可以继续加法计算。同时,还考虑了两种特殊情况:都是负数的情况和有0的情况。最后,通过使用Scanner类来获取输入数据。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 摘要: 在测试数据中,生成中文姓名是一个常见的需求。本文介绍了使用C#编写的随机生成中文姓名的方法,并分享了相关代码。作者欢迎读者提出意见和建议。 ... [详细]
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文介绍了一个Java猜拳小游戏的代码,通过使用Scanner类获取用户输入的拳的数字,并随机生成计算机的拳,然后判断胜负。该游戏可以选择剪刀、石头、布三种拳,通过比较两者的拳来决定胜负。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • 怎么在PHP项目中实现一个HTTP断点续传功能发布时间:2021-01-1916:26:06来源:亿速云阅读:96作者:Le ... [详细]
author-avatar
林秋伟左婷_894
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有