AI + MCP

数据分析工作坊

探索人工智能与数据分析的无限可能

滑动开始探索
1

活动安排

01

开场破冰自我介绍

认识彼此,建立连接

02

核心知识背景介绍

AI与MCP基础概念

03

数据分析讲解与实战

动手实践,深度学习

04

组队分析任务与答疑

团队协作,解决问题

05

其他MCP工具介绍

扩展工具箱

06

总结与反馈

回顾收获,展望未来

2

自我介绍

自我介绍
3

介绍大纲

我是做什么的?
我和AI的关系?
为什么对这个工作坊的内容感兴趣?
4

AI数据分析实战场景

学生成绩分析

排名计算、成绩可视化、数据清洗

身份证验证

校验码算法、数据验证、错误检测

个税计算

税率计算、占比分析、公式应用

信息提取

正则表达式、数据清理、格式化

5

分析学生成绩(实操测试)

数据文件 下载 CSV
学生姓名 班级 语文 数学 英语
卫静静 一班 83 87 92
褚瑞玲 一班 83 97 89
王娟超 一班 82 87 88
赵强瑞 一班 97 81 80
赵玲霞 一班 78 76 84
6

任务清单

1

计算每个人的总分

基础数据汇总与计算

2

计算班级平均分并找出最高班级

分组统计与比较分析

3

全年级排名(并列处理)

2个人并列第一则下一个是第三名

4

绘制各科成绩箱型图

数据分布可视化对比

5

不同班级课程平均分柱状图

多维度数据对比展示

6

删除语文最低分并导出

数据清洗与筛选处理

7

身份证号验证

数据文件 下载 XLSX
编号 身份证号
1500000199503235223
2510100198101196308
3310000199507233836
4120000199704120835
5310000198101205152
8

校验码算法详解

身份证校验规则
1

权重分配

为前17位数赋予固定权重

W = [7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2]
2

加权求和

计算加权和

S = Σ(aᵢ × Wᵢ) (i=1 to 17)
3

取模运算

对11取模

Y = S mod 11
4

映射校验码

根据ISO 7064:1983标准映射

0→1, 1→0, 2→X, 3→9, 4→8...

实战任务

身份证号各位数字求和
校验码正确性检测
9

个税计算

数据文件 下载 CSV
序号 人名 月工资金额
1张伟5,508
2王芳9,147
3李娜14,183
4刘洋14,987
5陈强15,987
10

个税计算规则与示例

个税计算规则

税率级距与速算扣除数

级距(月应纳) 税率 速算扣除数
≤ 3,0003%0
3,000 - 12,00010%210
12,000 - 25,00020%1,410
25,000 - 35,00025%2,660
35,000 - 55,00030%4,410
55,000 - 80,00035%7,160
> 80,00045%15,160

示例演算

假设条件:
税前工资 W = 20,000元
五险一金 S = 2,000元
专项附加扣除 D = 1,000元
1. 应纳税所得额:A = 20,000 - 2,000 - 5,000 - 1,000 = 12,000
2. 税率:10%,速算扣除数:210
3. 应纳税额:T = 12,000 × 10% - 210 = 990元
4. 缴费比例:R = 990/20,000 = 4.95%

实战任务

计算每个人的应交个税
计算个税占比工资总额
11

提取手机号码

数据文件 下载 CSV
大学名称 校长姓名 个人信息
北京大学 龚旗煌 家庭地址:北京市海淀区颐和园路5号; 手机号码:13811112222; 邮箱:gqhuang@pku.edu.cn
清华大学 郝平 邮箱:haoping@tsinghua.edu.cn; 家庭地址:北京市海淀区清华园1号; 手机号码:13922223333
复旦大学 许宁生 手机号码:13733334444; 邮箱:xuning@fudan.edu.cn; 家庭地址:上海市杨浦区邯郸路220号
上海交通大学 林忠钦 邮箱:linzhongqin@sjtu.edu.cn; 手机号码:13644445555; 家庭地址:上海市闵行区东川路800号
浙江大学 吴朝晖 手机号码:13555556666; 家庭地址:浙江省杭州市西湖区余杭塘路866号; 邮箱:wuzhaohui@zju.edu.cn
南京大学 李宁 家庭地址:江苏省南京市鼓楼区汉口路22号; 邮箱:lining@nju.edu.cn; 手机号码:15066667777

任务目标

使用正则表达式提取手机号码和邮箱地址生成新的列
12

高级内容

解锁更多精彩内容

13