别再手动下载了！用Python+国信QMT自动拉取股票历史Tick数据（附完整代码与避坑点）

张

张建站

2026/7/28 22:49:37

10分钟阅读

别再手动下载了！用Python+国信QMT自动拉取股票历史Tick数据（附完整代码与避坑点）

PythonQMT全自动获取股票Tick数据实战指南在量化交易领域获取高质量的Tick级数据是构建有效策略的基础。传统手动下载方式不仅效率低下还容易出错。本文将手把手教你如何用Python调用国信QMT的get_market_data_ex接口实现股票历史Tick数据的全自动获取与处理。1. 环境准备与QMT配置1.1 安装必要依赖确保你的Python环境已安装以下基础库pip install pandas numpy pytz注意QMT客户端通常自带Python环境建议使用其内置解释器以避免兼容性问题1.2 QMT权限配置登录QMT交易终端在系统设置中开启量化交易权限申请历史数据下载权限需券商审核不同券商权限开放程度可能不同建议提前联系客户经理确认2. 核心API详解与参数设置2.1 get_market_data_ex接口解析国信QMT提供的关键数据获取接口data C.get_market_data_ex( fields[open,high,low,close,volume,amount], stock_code[600000.SH], periodtick, start_time20240520093000, end_time20240520150000, count-1, dividend_typefollow, fill_dataTrue, subscribeFalse )关键参数说明参数名类型说明典型值periodstr数据周期tick(分笔)/1m(1分钟)start_timestr开始时间YYYYMMDDHHMMSSfill_databool是否填充缺失数据True/Falsecountint获取数据条数-1(全部)2.2 时间格式避坑指南常见错误直接使用datetime.now()生成的时间格式不兼容正确做法from datetime import datetime def format_qmt_time(dt): return dt.strftime(%Y%m%d%H%M%S) # 获取今天9:30-11:30的数据 start datetime.now().replace(hour9, minute30, second0) end datetime.now().replace(hour11, minute30, second0) formatted_start format_qmt_time(start) formatted_end format_qmt_time(end)3. 完整数据获取流程实现3.1 基础数据获取框架# encoding: utf-8 import pandas as pd from pytz import timezone def init(C): # 设置显示选项 pd.set_option(display.max_rows, 500) pd.set_option(display.max_columns, 10) pd.set_option(display.width, 1000) # 获取平安银行tick数据 stock_code 000001.SZ trade_date 20240520 tick_data get_history_ticks( C, stock_codestock_code, date_strtrade_date ) # 计算逐笔成交额变化 tick_data[delta_amount] tick_data[amount].diff() print(tick_data.head(10)) def get_history_ticks(C, stock_code, date_str): 获取单日全部tick数据 start_time f{date_str}093000 end_time f{date_str}150000 data C.get_market_data_ex( [price, volume, amount, bid, ask], [stock_code], periodtick, start_timestart_time, end_timeend_time, count-1, fill_dataFalse ) return data[stock_code]3.2 多日数据批量获取def batch_get_ticks(C, stock_code, start_date, end_date): 获取多日tick数据 date_range pd.date_range(start_date, end_date) all_data [] for date in date_range: if date.weekday() 5: # 跳过周末 continue date_str date.strftime(%Y%m%d) try: daily_data get_history_ticks(C, stock_code, date_str) daily_data[trade_date] date_str all_data.append(daily_data) except Exception as e: print(f获取{date_str}数据失败: {str(e)}) return pd.concat(all_data) if all_data else None4. 高级数据处理技巧4.1 Tick数据清洗与校验常见数据问题处理方案异常值过滤def filter_abnormal_ticks(df): # 价格异常 df df[(df[price] 0) (df[price] df[price].quantile(0.999))] # 成交量异常 df df[df[volume] df[volume].quantile(0.99)] return df时间连续性检查def check_time_gaps(df): df[datetime] pd.to_datetime(df.index) time_diff df[datetime].diff().dt.total_seconds() gaps time_diff[time_diff 5] # 超过5秒间隔 return gaps4.2 成交快照重构从逐笔数据重构盘口状态def reconstruct_orderbook(tick_df): book { ask1: None, ask_vol1: None, bid1: None, bid_vol1: None } snapshots [] for idx, row in tick_df.iterrows(): if not pd.isna(row[bid]): book[bid1] row[bid][0][0] book[bid_vol1] row[bid][0][1] if not pd.isna(row[ask]): book[ask1] row[ask][0][0] book[ask_vol1] row[ask][0][1] snapshot book.copy() snapshot[price] row[price] snapshot[volume] row[volume] snapshot[time] idx snapshots.append(snapshot) return pd.DataFrame(snapshots).set_index(time)5. 性能优化与实战建议5.1 数据获取加速技巧并行下载对多只股票使用线程池from concurrent.futures import ThreadPoolExecutor def parallel_download(C, stock_list, date_str): with ThreadPoolExecutor(max_workers5) as executor: futures { stock: executor.submit(get_history_ticks, C, stock, date_str) for stock in stock_list } return {k: v.result() for k, v in futures.items()}增量更新只获取最新数据def get_incremental_ticks(C, stock_code, last_time): now datetime.now(timezone(Asia/Shanghai)) start_time format_qmt_time(last_time) end_time format_qmt_time(now) return get_history_ticks(C, stock_code, start_time, end_time)5.2 数据存储方案对比存储方式优点缺点适用场景CSV简单直观读写慢小规模数据HDF5高速IO单文件限制中型数据集Parquet列式存储需要额外库大规模数据数据库易查询需要维护生产环境推荐方案# 使用PyArrow保存Parquet tick_data.to_parquet(ticks.parquet, enginepyarrow) # 带压缩版本 tick_data.to_parquet( ticks_compressed.parquet, enginepyarrow, compressionsnappy )在实际项目中这套自动化方案将数据获取时间从原来的小时级缩短到分钟级且完全避免了人工操作可能带来的错误。一个特别实用的技巧是建立数据校验机制在每天收盘后自动验证当日数据的完整性和准确性。

5分钟终极指南：使用KMS_VL_ALL_AIO智能激活Windows和Office

5分钟终极指南：使用KMS_VL_ALL_AIO智能激活Windows和Office 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统未激活的水印烦恼吗？Office软件突然变成只读…...

2026/5/21 7:50:13 阅读更多 →

从零到Offer：一名计算机保研生的实战推免指南与心路剖析

1. 保研前的准备：从迷茫到清晰定位记得大三上学期刚开学那会儿，我还在纠结要不要考研。当时对保研流程完全不了解，甚至分不清夏令营、预推免和九推的区别。直到辅导员在年级大会上详细讲解了保研政策，我才意识到自己可能有机会。…...

2026/5/21 7:50:11 阅读更多 →

中国车牌识别终极指南：基于CCPD数据集的高效车牌检测与识别方案

中国车牌识别终极指南：基于CCPD数据集的高效车牌检测与识别方案【免费下载链接】CCPD [ECCV 2018] CCPD: a diverse and well-annotated dataset for license plate detection and recognition 项目地址: https://gitcode.com/gh_mirrors/cc/CCPD 还在为复杂…...

2026/5/24 11:34:17 阅读更多 →

大模型 Agent 三面被问：怎么解决 Skill 的依赖关系？我是这么答的

前段时间有个读者去面某大厂的 Agent 岗位，三面被甩出来一道题当场卡壳。题目听着挺朴素：“如果你的 Agent 里面有很多 Skill，Skill 之间还存在依赖关系的话，你打算怎么去设计来解决这个问题？” 他跟我复盘的时候说&a…...

2026/7/28 17:22:23 阅读更多 →

抱怨应试教育的苦，却不知道：那已经是人生里最轻松、最公平的一段路了

能靠考试得到的东西，都是天上掉馅饼上学的时候，总觉得考试是天底下最熬人的苦。背不完的知识点，刷不完的题，熬不完的夜，一张卷子定输赢的应试制度，曾被无数人吐槽是束缚、是枷锁。那时候总天真地以为，等走出校园、踏入社会，就能摆脱考试的桎梏，凭真本事自由闯荡。 …...

2026/7/28 21:12:22 阅读更多 →

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Z…...

2026/7/28 19:39:15 阅读更多 →