上课信息
上课时间:
2026年7月23-26日 (四天)
9:00-12:00;14:00-17:00;答疑交流
上课地点: 北京现场班, 同步远程直播; 均提供录播回放
1. 机器学习基本思想与分类
2. 常用算法速览与学术选型逻辑
3. 机器学习评价标准与经管学科适用性
4. Python算法库生态:sklearn、XGBoost、LightGBM、statsmodels
1. 金融预测:宏观经济、企业财务、市场波动预测
2. 代理变量构造:从非结构化文本/图像提取预测能力变量
3. 因果推断:因果图模型、双重机器学习识别政策效应
4. 时间序列:ARIMA、LSTM动态建模收入/销售/股价
5. 异常检测与聚类:反舞弊审计、客户分层、竞争格局分析
• 【智能体辅助:环境配置与工具链搭建】 配置Python环境、自动安装依赖、调试与排错
• 【智能体辅助:代码框架生成】 输入研究目标,智能体自动生成完整机器学习Pipeline代码模板
• 【智能体辅助:原理可视化解释】 用对话式交互让智能体解释复杂概念(如正则化、核函数、信息增益),生成定制化教学图
定制化教学图
• 【智能体辅助:学术Prompt工程】 教授如何向智能体下指令,使其输出符合经管学术规范的代码与表述
1. 特征工程体系
• 无量纲化、分箱编码、统计变换
• 特征选择:过滤法、嵌入法、包装法
• 特征转换:PCA、因子分析、TSNE可视化
2. 线性回归与逻辑回归
• 原理、正则化(L1/L2)、参数优化
• 场景:信用风险、员工流失、财务舞弊、增长评估
• 【智能体辅助:端到端回归建模】 输入CSV数据路径,智能体自动完成数据清洗、变量筛选、模型训练、VIF诊断、结果输出
断、结果输出
• 【智能体辅助:回归结果学术化解读】 自动将系数表、显著性星星、R²翻译成论文
• 案例实操:数字化人力资源之员工流失风险预警(智能体实时生成代码与解读)
1. KNN与SVM
• KNN原理、分类/回归、调参优化
• SVM原理、线性/非线性、核函数选择
• 场景:客户行为预测、欺诈识别、信用评分、人岗匹配
• 【智能体辅助:核函数自动对比实验】 智能体自动运行线性/多项式/RBF核对比,输出准确率对比
• 【智能体辅助:分类边界可视化代码生成】 自动生成高维数据降维后的决策边界图
• 案例实操:患者疾病预测 + 上市公司欺诈预测(智能体实时辅助)
2. 决策树与随机森林
• 决策树原理、可视化、参数优化
• 集成学习:随机森林、XGBoost、LightGBM原理与调参
• 场景:营销响应、信贷审批、客户流失、财务预警、多因子选股
• 【智能体辅助:树模型可视化与解释】 自动生成决策树路径图、特征重要性条形图、SHAP力图
• 【智能体辅助:XGBoost超参数自动搜索】 智能体编写贝叶斯优化/网格搜索代码,自动输出最优参数组合
• 案例实操:保险行业用户画像 + 随机森林多因子选股策略(智能体实时辅助)
1. 因果树原理、分类、实现与调参
2. 因果森林原理、与随机森林对比、实现与优调
3. 双重机器学习(DML):Neyman正交性、实现方法
4. 因果模型评估方法与可解释性工具
5. 场景:广告效果评估、定价策略、教育/培训项目评估、政策干预
6. 【智能体辅助:因果模型自动选择】 输入处理变量与结果变量,智能体自动推荐因果树/因果森林/DML,并生成代码
代码
7. 【智能体辅助:异质性处理效应可视化】 自动生成ATE/CATE分组图表,并撰写
8. 【智能体辅助:稳健性检验代码生成】 自动生成交叉验证、安慰剂检验、置换检验全套代码
9. 案例实操:教育干预异质性分析 + 差异化定价策略效果评估(智能体全程辅助)
1. 贝叶斯原理、朴素贝叶斯、模型分类与局限
2. 大模型增强的文本嵌入与分类回归
3. 场景:舆情监测、客户评论分析、财经文本分类、招股书文本分析
4. 【智能体辅助:文本自动标注与清洗】 智能体对原始文本进行零样本情感标注、去重、分词、去停用词
5. 【智能体辅助:文本嵌入生成与降维可视化】 调用大模型API生成embedding,自动运行t-SNE/UMAP可视化
6. 案例实操:利用贝叶斯进行情感分析(智能体辅助文本预处理与建模)
1. 孤立森林原理、参数解读、训练预测、异常可视化
• 场景:智能审计、反舞弊
• 【智能体辅助:异常点业务解读】 智能体自动分析异常点特征,生成
• 案例实操:信用卡欺诈识别(智能体辅助)
2. 聚类分析
• K-Means、DBSCAN、层次聚类
• 聚类特征工程、算法选择、评估指标
• 场景:客户分群、供应链优化、竞争对手分析
• 【智能体辅助:聚类结果业务命名与画像生成】 智能体自动为每个簇生成业务标签(如"高价值低活跃客户")和
人群描述
• 案例实操:航空客户人群细分(智能体辅助生成客户画像报告)
1. ARIMA
• 时间序列特性、平稳化、自相关/偏自相关
• ARIMA流程:参数选择、模型拟合、诊断检验
• 【智能体辅助:ADF检验与差分阶数自动判定】 智能体自动运行平稳性检验,输出差分建议与参数推荐
• 案例实操:销售额数据预测(智能体辅助自动建模)
2. RNN与LSTM
• RNN与LSTM核心思想、结构、变体
• LSTM+注意力机制、超参数调优与可视化
• 【智能体辅助:序列数据预处理与窗口划分】 智能体自动处理缺失值、生成时间窗口、划分训练验证集
• 案例实操:股票价格预测(智能体辅助)
1. 模型稳健性检验规范
• 交叉验证策略、过拟合诊断、正则化选择
2. 学术写作规范
• 方法段落的标准表述模板
• 结果表格(系数表、混淆矩阵、ROC曲线、特征重要性表)的论文格式
3. 【智能体辅助:论文方法段落一键生成】 输入模型类型与结果,智能体自动生成符合经管顶刊规范的方法描述
4. 【智能体辅助:图表学术级美化】 智能体自动调整matplotlib/seaborn配色、字体、标注,生成期刊投稿级图表
• 示范课题(以金融预测为例):
1. 数据获取与清洗(智能体辅助代码生成)
2. 特征工程与变量筛选(智能体辅助自动处理)
3. 模型对比实验(线性回归→随机森林→XGBoost→LSTM,智能体辅助调参)
4. 推断验证(智能体辅助稳健性检验)
5. 结果解释与图表生成(智能体辅助学术化输出)
6. 方法段落与结果表格的论文初稿生成(智能体辅助)
• 【智能体辅助:全流程代码整合】 智能体将分散模块整合为可复现的完整项目文件
| 报名时间 | 2026-05-25 00:00 至 2026-07-23 00:00 |
|---|---|
| 培训时间 | 2026年7月23-26日 (四天) |
| 培训地点 | 北京现场班, 同步远程直播; 均提供录播回放 |
| 培训费用 | 4500元, 提供电子版发票+通知+结业证书 |
| 授课安排 | 9:00-12:00;14:00-17:00;答疑交流 |
【授课老师】
陈老师,国内顶尖高校博导,北京大学博士,北京大学优秀博士后,机器学习与人工智能资深讲师。
主要科研方向:数据分析、大数据处理、人工智能。发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,授权国家发明专利20余项。主持国家自然科学基金面上项目,国家重点研发计划课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。自然科学基金函评专家。IEEE、OSA会员,多个SCI期刊审稿人。
【课程特色】
1. 学术场景驱动
围绕金融预测、代理变量构造、因果推断、时间序列、异常检测与聚类等经管学科高频需求展开,算法讲解与学术选题紧密结合,避免泛泛而谈。
2. 智能体全流程嵌入
每个技术模块均设置“智能体辅助”环节,涵盖环境配置、代码框架生成、原理可视化解释、学术Prompt工程、回归结果学术化解读、图表美化、稳健性检验代码生成等,帮助降低代码门槛。
3. 四天递进式架构
第一天搭建基础框架与工具链;第二天深入经典算法与协同建模;第三天攻克因果推断、文本分析与聚类;第四天聚焦时间序列与学术成果规范化输出,层层深入。
4. 完整示范与可复现产出
最后一天进行综合案例串讲,讲师带领完成一个从数据获取、特征工程、模型对比、推断验证到论文初稿生成的完整研究示范,学员可带走项目代码、数据与论文模板,回校后参照替换自身数据复现。
【课程目标】
1. 理解机器学习基本思想、常用算法原理及在经管学科中的适用场景、评价标准与选型逻辑。
2. 掌握特征工程、回归、树模型、SVM、聚类、时间序列等核心建模方法,能够配合智能体工具完成数据清洗、模型训练、调参与诊断。
3. 学会运用AI智能体辅助学术研究工作流,包括生成符合经管学术规范的代码、解释复杂概念、输出期刊级图表及撰写方法段落。
4. 通过完整案例实操,熟悉从数据到论文的研究全流程,获得一套可复现的示范项目文件,具备回校后替换自身数据独立复现的能力。
【课程大纲】
第一天:基础框架与智能体工具链
模块一:机器学习基础与学术范式
1. 机器学习基本思想与分类
2. 常用算法速览与学术选型逻辑
3. 机器学习评价标准与经管学科适用性
4. Python算法库生态:sklearn、XGBoost、LightGBM、statsmodels
模块二:机器学习在学术中的五大典型应用
1. 金融预测:宏观经济、企业财务、市场波动预测
2. 代理变量构造:从非结构化文本/图像提取预测能力变量
3. 因果推断:因果图模型、双重机器学习识别政策效应
4. 时间序列:ARIMA、LSTM动态建模收入/销售/股价
5. 异常检测与聚类:反舞弊审计、客户分层、竞争格局分析
模块三:智能体工具链入门——你的学术建模助手
1. 【智能体辅助:环境配置与工具链搭建】 配置Python环境、自动安装依赖、调试与排错
2. 【智能体辅助:代码框架生成】 输入研究目标,智能体自动生成完整机器学习Pipeline代码模板
3. 【智能体辅助:原理可视化解释】 用对话式交互让智能体解释复杂概念(如正则化、核函数、信息增益),生成定制化教学图
4. 【智能体辅助:学术Prompt工程】 教授如何向智能体下指令,使其输出符合经管学术规范的代码与表述
第二天:经典算法与智能体协同建模
模块四:特征工程与回归模型
1. 特征工程体系
· 无量纲化、分箱编码、统计变换
· 特征选择:过滤法、嵌入法、包装法
· 特征转换:PCA、因子分析、TSNE可视化
2. 线性回归与逻辑回归
· 原理、正则化(L1/L2)、参数优化
· 场景:信用风险、员工流失、财务舞弊、增长评估
· 【智能体辅助:端到端回归建模】 输入CSV数据路径,智能体自动完成数据清洗、变量筛选、模型训练、VIF诊断、结果输出
· 【智能体辅助:回归结果学术化解读】 自动将系数表、显著性星星、R²翻译成论文"结果分析"段落
案例实操:数字化人力资源之员工流失风险预警(智能体实时生成代码与解读)
模块五:KNN、SVM与树模型
1. KNN与SVM
· KNN原理、分类/回归、调参优化
· SVM原理、线性/非线性、核函数选择
· 场景:客户行为预测、欺诈识别、信用评分、人岗匹配
· 【智能体辅助:核函数自动对比实验】 智能体自动运行线性/多项式/RBF核对比,输出准确率对比
· 【智能体辅助:分类边界可视化代码生成】 自动生成高维数据降维后的决策边界图
· 案例实操:患者疾病预测 + 上市公司欺诈预测(智能体实时辅助)
2. 决策树与随机森林
· 决策树原理、可视化、参数优化
· 集成学习:随机森林、XGBoost、LightGBM原理与调参
· 场景:营销响应、信贷审批、客户流失、财务预警、多因子选股
· 【智能体辅助:树模型可视化与解释】 自动生成决策树路径图、特征重要性条形图、SHAP力图
· 【智能体辅助:XGBoost超参数自动搜索】 智能体编写贝叶斯优化/网格搜索代码,自动输出最优参数组合
· 案例实操:保险行业用户画像 + 随机森林多因子选股策略(智能体实时辅助)
第三天:高阶推断与复杂数据建模
模块六:因果推断
1. 因果树原理、分类、实现与调参
2. 因果森林原理、与随机森林对比、实现与优调
3. 双重机器学习(DML):Neyman正交性、实现方法
4. 因果模型评估方法与可解释性工具
5. 场景:广告效果评估、定价策略、教育/培训项目评估、政策干预
6. 【智能体辅助:因果模型自动选择】 输入处理变量与结果变量,智能体自动推荐因果树/因果森林/DML,并生成代码
7.【智能体辅助:异质性处理效应可视化】 自动生成ATE/CATE分组图表,并撰写"政策建议"描述文本
8.【智能体辅助:稳健性检验代码生成】 自动生成交叉验证、安慰剂检验、置换检验全套代码
9. 案例实操:教育干预异质性分析 + 差异化定价策略效果评估(智能体全程辅助)
模块七:贝叶斯与文本数据
1. 贝叶斯原理、朴素贝叶斯、模型分类与局限
2. 大模型增强的文本嵌入与分类回归
3. 场景:舆情监测、客户评论分析、财经文本分类、招股书文本分析
4. 【智能体辅助:文本自动标注与清洗】 智能体对原始文本进行零样本情感标注、去重、分词、去停用词
5. 【智能体辅助:文本嵌入生成与降维可视化】 调用大模型API生成embedding,自动运行t-SNE/UMAP可视化
6. 案例实操:利用贝叶斯进行情感分析(智能体辅助文本预处理与建模)
模块八:孤立森林与聚类
1. 孤立森林原理、参数解读、训练预测、异常可视化
· 场景:智能审计、反舞弊
· 【智能体辅助:异常点业务解读】 智能体自动分析异常点特征,生成"审计线索描述"文本
· 案例实操:信用卡欺诈识别(智能体辅助)
2. 聚类分析
· K-Means、DBSCAN、层次聚类
· 聚类特征工程、算法选择、评估指标
· 场景:客户分群、供应链优化、竞争对手分析
· 【智能体辅助:聚类结果业务命名与画像生成】 智能体自动为每个簇生成业务标签(如"高价值低活跃客户")和人群描述
· 案例实操:航空客户人群细分(智能体辅助生成客户画像报告)
第四天:时间序列与综合学术产出
模块九:时间序列分析
1. ARIMA
· 时间序列特性、平稳化、自相关/偏自相关
· ARIMA流程:参数选择、模型拟合、诊断检验
· 【智能体辅助:ADF检验与差分阶数自动判定】 智能体自动运行平稳性检验,输出差分建议与参数推荐
· 案例实操:销售额数据预测(智能体辅助自动建模)
2. RNN与LSTM
· RNN与LSTM核心思想、结构、变体
· LSTM+注意力机制、超参数调优与可视化
· 【智能体辅助:序列数据预处理与窗口划分】 智能体自动处理缺失值、生成时间窗口、划分训练验证集
· 案例实操:股票价格预测(智能体辅助)
模块十:机器学习学术成果规范化输出
1. 模型稳健性检验规范
· 交叉验证策略、过拟合诊断、正则化选择
2. 学术写作规范
· 方法段落的标准表述模板
· 结果表格(系数表、混淆矩阵、ROC曲线、特征重要性表)的论文格式
3. 【智能体辅助:论文方法段落一键生成】 输入模型类型与结果,智能体自动生成符合经管顶刊规范的方法描述
4. 【智能体辅助:图表学术级美化】 智能体自动调整matplotlib/seaborn配色、字体、标注,生成期刊投稿级图表
模块十一:综合案例串讲——从数据到论文的完整流水线
示范课题(以金融预测为例):
1. 数据获取与清洗(智能体辅助代码生成)
2. 特征工程与变量筛选(智能体辅助自动处理)
3. 模型对比实验(线性回归→随机森林→XGBoost→LSTM,智能体辅助调参)
4. 推断验证(智能体辅助稳健性检验)
5. 结果解释与图表生成(智能体辅助学术化输出)
6. 方法段落与结果表格的论文初稿生成(智能体辅助)
【智能体辅助:全流程代码整合】 智能体将分散模块整合为可复现的完整项目文件
【联系方式】
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu

内容不能少于5个字符!
顾问微信
©2026Peixun.net 北京国富如荷网络科技有限公司 版权所有 未经许可 请勿转载
京ICP备11001960号-4
京公网安备 11010802034634号
邮件已发送!
已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码
分享
收藏
