047、Pandas数据清洗:处理缺失值与重复值昨天排查线上问题,一个数据分析脚本突然报错KeyError,追查发现是某列数据突然出现大量NaN,下游处理没做容错直接用了字典推导。这种问题在真实数据中太常见了——传感器断连、用户未填写、系统导出异常,缺失值和重复值就像代码里的bug,不处理干净迟早要出事。缺失值检测:先看清楚战场拿到数据集别急着处理,用info()看整体情况:importpandasaspd df=pd.read_csv('sensor_data.csv')print(df.inf