Python数据处理的三个实用技巧分享

张

张建站

2026/7/30 5:29:28

10分钟阅读

我使用的 Pandas 版本如下顺便也导入 Pandas 库。123importpandas as pd pd.__version__0.25.1在开始前先确保解释器和数据集在同一目录下1234importos os.chdir(D://source/dataset)# 这是我的数据集所在目录 os.listdir()# 确认此目录已经存在 IMDB-Movie-Data 数据集[drinksbycountry.csv,IMDB-Movie-Data.csv,movietweetings,titanic_eda_data.csv,titanic_train_data.csv]准备工作就位后正式开始数据处理技巧之旅。1 Pandas 移除某列导入数据123456 dfpd.read_csv(IMDB-Movie-Data.csv) df.head(1)# 导入并显示第一行Rank Title Genre ... Votes Revenue (Millions) Metascore01Guardians of the Galaxy Action,Adventure,Sci-Fi ...757074333.1376.0[1rows x12columns]使用 pop 方法移除指定列1 metadf.pop(Title).to_frame()# 移除 Title 列确认是否已被移除12345 df.head(1)# df 变为 11列Rank Genre ... Revenue (Millions) Metascore01Action,Adventure,Sci-Fi ...333.1376.0[1rows x11columns]2 统计标题单词数pop 后得到 meta显示 meta 前 3 行12345 meta.head(3)Title0Guardians of the Galaxy1Prometheus2Split标题是由单词组成中间用空格分隔。1234567# .str.count( ) 1 得到单词个数 meta[words_count]meta[Title].str.count( )1 meta.head(3)# words_count 列代表单词个数Title words_count0Guardians of the Galaxy41Prometheus12Split13 Genre 频次统计下面统计电影 Genre 的频次1 vcdf[Genre].value_counts()下面显示电影 Genre 的 Top5 最高频为出现 50 次的 Action,Adventure,Sci-Fi 类次之为 48 次的 Drama 类1234567 vc.head()Action,Adventure,Sci-Fi50Drama48Comedy,Drama,Romance35Comedy32Drama,Romance31Name: Genre, dtype: int64展示 Top5 的饼状图1234importmatplotlib.pyplot as plt vc[:5].plot(kindpie)matplotlib.axes._subplots.AxesSubplotobjectat0x000001D65B114948 plt.show()到此这篇关于Python数据处理的三个实用技巧分享的文章就介绍到这了

亲测可用！GEO源码全套搭建教程（Docker+宝塔双方案，附合法开源源码获取）

亲测可用！GEO源码全套搭建教程（Docker宝塔双方案，附合法开源源码获取） 前言：GEO源码搭建是地理信息开发、位置服务部署领域的核心技能，广泛应用于本地地理数据可视化、企业级位置服务平台搭建及GIS学习场景…...

2026/7/20 17:24:35 阅读更多 →

视频创作工具持续升级跨境社媒内容生产流程如何做轻量化

指尖上的全球剧场：轻量化赋能跨境内容新浪潮清晨，巴黎的咖啡馆里，一位时尚博主用手机拍摄着精致的早餐；午后，东京的街头，旅行达人用便携稳定器记录着城市脉搏；深夜，纽约的公寓中&…...

2026/5/23 11:10:17 阅读更多 →

系统性能瓶颈分析与优化

系列导读：本篇将深入讲解系统性能瓶颈的分析方法与优化策略。文章目录目录一、性能指标1.1 核心指标1.2 性能公式二、瓶颈分析方法2.1 分析工具2.2 分析流程三、CPU 瓶颈优化3.1 CPU 飙高分析3.2 优化策略3.3 代码示例四、内存瓶颈优化4.1 内存分析4.2 优化策略五、…...

2026/7/12 3:30:58 阅读更多 →

大模型 Agent 三面被问：怎么解决 Skill 的依赖关系？我是这么答的

前段时间有个读者去面某大厂的 Agent 岗位，三面被甩出来一道题当场卡壳。题目听着挺朴素：“如果你的 Agent 里面有很多 Skill，Skill 之间还存在依赖关系的话，你打算怎么去设计来解决这个问题？” 他跟我复盘的时候说&a…...

2026/7/28 17:22:23 阅读更多 →

抱怨应试教育的苦，却不知道：那已经是人生里最轻松、最公平的一段路了

能靠考试得到的东西，都是天上掉馅饼上学的时候，总觉得考试是天底下最熬人的苦。背不完的知识点，刷不完的题，熬不完的夜，一张卷子定输赢的应试制度，曾被无数人吐槽是束缚、是枷锁。那时候总天真地以为，等走出校园、踏入社会，就能摆脱考试的桎梏，凭真本事自由闯荡。 …...

2026/7/30 0:33:36 阅读更多 →

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Z…...

2026/7/28 19:39:15 阅读更多 →