例如,将1分钟数据重新索引到每日数据(例如16:00的每日价格索引),如果某一天的16:00时间戳没有1分钟数据的情况,我们希望从最后一个非空1min数据转发填充.在下面的例子中,13日16:00之前没有1min数据,最后1min数据来自10日.
当使用带有method ='ffill'的reindex时,不会期望下面的代码在16:00在16:00填写值吗?检查daily1表明它缺失了.
import pandas as pd import numpy as np hf_index = pd.date_range(start='2013-05-09 9:00', end='2013-05-13 23:59', freq='1min') hf_prices = np.random.rand(len(hf_index)) hf = pd.DataFrame(hf_prices, index=hf_index) hf.ix['2013-05-10 18:00':'2013-05-13 18:00',:]=np.nan hf.plot() ind_daily = pd.date_range(start='2013-05-09 16:00', end='2013-05-13 16:00', freq='B') print(ind_daily.values) daily1 = hf.reindex(index=ind_daily, method='ffill')
要填写为一个(或者更确切地说是我)期望,我需要这样做:
daily2 = daily1.fillna(method='ffill')
如果是这种情况,reindex实际上做的填充方法是什么.我只是从熊猫文档中不清楚.在我看来,我不应该做上述这一行.