ICM 2026 美赛复盘:GPT Event Study + 面板数据分析
背景
2026年寒假,我和队友参加了美国大学生数学建模竞赛(ICM)F题。这是一次将AI技术应用于经济研究的绝佳实践。
选题思路
F题要求分析AI对就业市场的影响。我们选择了Event Study(事件研究法)作为核心方法,但创新性地使用GPT来:
- 自动识别AI相关事件:用GPT从新闻数据中提取AI技术突破事件
- 量化事件冲击:构建事件窗口,计算异常收益率
- 面板数据分析:使用PanelOLS进行固定效应回归
技术实现
数据处理
# 使用tushare获取股票数据
import tushare as ts
pro = ts.pro_api()
df = pro.daily(ts_code='000001.SZ', start_date='20200101', end_date='20260101')
GPT事件识别
# 用GPT API提取AI事件
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[{
"role": "user",
"content": f"从以下新闻中识别AI相关技术突破事件:{news_text}"
}]
)
面板回归
# PanelOLS固定效应回归
from linearmodels.panel import PanelOLS
model = PanelOLS(dependent=y, exog=X, entity_effects=True, time_effects=True)
result = model.fit()
关键发现
- AI技术突破对科技股有显著正向冲击,但对传统行业影响有限
- 事件窗口长度选择对结果敏感,建议使用多个窗口稳健性检验
- GPT在事件识别上的准确率达到了85%以上
踩坑记录
- 数据清洗:OEWS数据格式不一致,需要大量预处理
- 多重共线性:控制变量之间存在高度相关,需要VIF检验
- 稳健性检验:至少3种方法才能说服评委
收获
这次比赛让我深刻理解了:
- 学术研究的完整流程
- AI工具在经济学研究中的应用
- 团队协作的重要性
完整的代码和报告已上传到CNB仓库。