df=pd.DataFrame({'col1':[25021,25002,8002,40211,2232,""]})

    col1    
0   25021    
1   25002
2   8002
3   40211
4   2232
5   

Chciałbym uzyskać następujące informacje, nie jestem pewien, jak podzielić na podstawie ostatnich 3 cyfr na col3 i cokolwiek poprzedzającego na col1

    col2   col3    
0   25     021       
1   25     002       
2   8      002      
3   40     211       
4   2      232 
5
2
bdoe85 3 kwiecień 2020, 05:20

3 odpowiedzi

Najlepsza odpowiedź

To jest moje podejście:

df['col2'] = df['col1'].astype(str).str[-3:]

df['col1'] = df['col1'].astype(str).str[:-3]

Wynik:

   col1 col2
0    25  021
1    25  002
2     8  002
3    40  211
4     2  232
2
Quang Hoang 3 kwiecień 2020, 03:06

Spróbuj tego.

df=pd.DataFrame({'col1':[25021,25002,8002,40211,2232]})
df['col2'] = df['col1'].astype(str).apply(lambda x:x[-3:]).astype(int)
df['col1'] = df['col1'].astype(str).apply(lambda x:x[:-3]).astype(int)
0
Gilseung Ahn 3 kwiecień 2020, 02:31

Wystarczy zagrać na metoda podziału ciągów; możesz zawinąć separator (w wyrażeniu regularnym), tak aby został uwzględniony w wyniku:

(df
 .astype(str)
 .col1
 .str.split(r'(\d{3}$)', n=1, expand=True)
 .drop(2,axis=1)
 .set_axis(['col1','col2'],axis='columns')
)

    col1    col2
0    25     021
1    25     002
2    8      002
3    40     211
4    2      232
0
sammywemmy 3 kwiecień 2020, 03:16