dataframe筛选赋值的陷阱
dataframe筛选赋值,是生成了一个对dataframe局部的引用,比如df1 = df[df['label'].isin([1,2])],这个时候df1就是df的局部引用,然后对df1赋值,在ali线上环境我发现速度很慢,在本地也比较慢,但是没有ali线上环境那么慢,我觉得背后的机制也不应该是进行了二次寻址,这个引用应该能直接找到数据的原始地址才对啊!但是现象就如前面所述!所以最安全的方法就是df1 = df[df['label'].isin([1,2])].copy()。
留言
張貼留言