Obecnie próbuję zbudować dataframe składające się z codziennych stawek Skarbu Państwa. Jak widać, Pandas automatycznie formatuje kolumny, aby były w porządku, które wyraźnie nie chcę. Oto niektóre z mojego kodu. Musiałem tylko niewielki przykład, aby pokazać problem, który mam.

import quandl
import matplotlib.pyplot as plt

One_Month = quandl.get('FRED/DGS1MO')

^^ powtórzony dla wszystkich stawek

Yield_Curve = pd.DataFrame({'1m': One_Month['Value'], '3m': Three_Month['Value'], '1yr': One_Year['Value']})
Yield_Curve.loc['2017-06-22'].plot()
plt.show()

enter image description here

Yield_Curve.tail()


       1m   1yr   3m
Date      
2017-06-16 0.85  1.21  1.03
2017-06-19 0.85  1.22  1.02
2017-06-20 0.88  1.22  1.01
2017-06-21 0.85  1.22  0.99
2017-06-22 0.80  1.22  0.96

Jak powiedziałem, dodałem tylko trzy stawki do Dataframe, ale oczywiście dwa rok, trzyletnie, a pięcioletni stawki spowoduje również problem.

Wyszuwałem i zobaczyłem ten post: kreślarstwo Skarbowa krzywa, jak nakładać Dwa krzywe plonów przy użyciu matplotlib

Podczas korzystania z kodu w ostatnim postu wyraźnie działa, wolałbym być w stanie zachować moje obecne zestawy danych (One_month, Three_month ....) Aby to zrobić, ponieważ używam ich do innych analiz.

Pytanie: Czy jest dla mnie sposób, aby zablokować kolejność kolumny?

Dzięki za pomoc!

4
Tom 26 czerwiec 2017, 02:29

4 odpowiedzi

Najlepsza odpowiedź

Za pomocą pandas-datareader możesz określić symbole jako jedną listę. Oprócz użycia reindex_axis, jak sugeruje @andrew L, możesz również przejść listę zamówionych kolumn z dwoma wspornikami, patrz końcowa linia poniżej, aby określić kolejność kolumny.

from pandas_datareader.data import DataReader as dr
syms = ['DGS10', 'DGS5', 'DGS2', 'DGS1MO', 'DGS3MO']
yc = dr(syms, 'fred') # could specify start date with start param here
names = dict(zip(syms, ['10yr', '5yr', '2yr', '1m', '3m']))
yc = yc.rename(columns=names)
yc = yc[['1m', '3m', '2yr', '5yr', '10yr']]

print(yc)
       1m  3m  2yr  5yr 10yr
DATE                  
2010-01-01  NaN  NaN  NaN  NaN  NaN
2010-01-04 0.05 0.08 1.09 2.65 3.85
2010-01-05 0.03 0.07 1.01 2.56 3.77
2010-01-06 0.03 0.06 1.01 2.60 3.85
2010-01-07 0.02 0.05 1.03 2.62 3.85
     ...  ...  ...  ...  ...
2017-06-16 0.85 1.03 1.32 1.75 2.16
2017-06-19 0.85 1.02 1.36 1.80 2.19
2017-06-20 0.88 1.01 1.36 1.77 2.16
2017-06-21 0.85 0.99 1.36 1.78 2.16
2017-06-22 0.80 0.96 1.34 1.76 2.15

yc.loc['2016-06-01'].plot(label='Jun 1')
yc.loc['2016-06-02'].plot(label='Jun 2')
plt.legend(loc=0)

enter image description here

2
Brad Solomon 26 czerwiec 2017, 00:03

Możesz także wyciągnąć wszystkie stawki historyczne bezpośrednio ze strony internetowej Skarbu USA (aktualizowane codziennie):

from bs4 import BeautifulSoup
import requests
import pandas as pd

soup = BeautifulSoup(requests.get('https://data.treasury.gov/feed.svc/DailyTreasuryYieldCurveRateData').text,'lxml')
table = soup.find_all('m:properties')
tbondvalues = []
for i in table:
  tbondvalues.append([i.find('d:new_date').text[:10],i.find('d:bc_1month').text,i.find('d:bc_2month').text,i.find('d:bc_3month').text,i.find('d:bc_6month').text,i.find('d:bc_1year').text,i.find('d:bc_2year').text,i.find('d:bc_3year').text,i.find('d:bc_5year').text,i.find('d:bc_10year').text,i.find('d:bc_20year').text,i.find('d:bc_30year').text])
ustcurve = pd.DataFrame(tbondvalues,columns=['date','1m','2m','3m','6m','1y','2y','3y','5y','10y','20y','30y'])
ustcurve.iloc[:,1:] = ustcurve.iloc[:,1:].apply(pd.to_numeric)/100
ustcurve['date'] = pd.to_datetime(ustcurve['date'])
0
oisinkenn 11 lipiec 2020, 18:26

Jeśli nie chcesz zmieniać oryginalnego zamówienia kolumny pomimo, musisz posortować kolumnę do notacji finansowej, myślę, że powinieneś wykonać własną niestandardową kolejność kolumny jak poniżej.

fi_col = df.columns.str.extract('(\d)(\D+)', expand=True).sort_values([1, 0]).reset_index(drop=True)
fi_col = fi_col[0] + fi_col[1]

print(df[fi_col])

       1m  3m  1yr
Date            
2017-06-16 0.85 1.03 1.21
2017-06-19 0.85 1.02 1.22
2017-06-20 0.88 1.01 1.22
2017-06-21 0.85 0.99 1.22
2017-06-22 0.80 0.96 1.22
2
su79eu7k 25 czerwiec 2017, 23:55

Jeśli chcesz zdefiniować zamówienie kolumny, możesz użyć reindex_axis():

df = df.reindex_axis(labels=['1m', '3m', '1yr'], axis=1)

df
       1m  3m  1yr
Date            
2017-06-16 0.85 1.03 1.21
2017-06-19 0.85 1.02 1.22
2017-06-20 0.88 1.01 1.22
2017-06-21 0.85 0.99 1.22
2017-06-22 0.80 0.96 1.22
4
Andrew L 25 czerwiec 2017, 23:52