Peixun.net > 直播 > 计量实证分析 > Python师资培训-文本分析

Python师资培训-文本分析

满意程度:     课程系列:A5
课时:0 分钟| 287人学习 分享 收藏
611分钟在线学习, 随报随学;
提供资料及主讲老师答疑
支付后请联系JG学术培训-尹老师,微信:JGxueshu,电话:13321178792
购买链接: https://www.peixun.net/main.php?mod=buy&cid=1597

Python师资培训-文本分析

文本处理常用字符串方法精讲

字符串的不变性

排序行

段落格式化

二进制转化为ASCII

重复字词过滤

提取邮件地址

提取URL地址

大写转换

符号化

删除停用词

同义词与反义词处理

文本翻译

单词替换

拼写检查

WordNet接口

语料访问

标记单词

块和裂口

块分类

文本分类

双字母组

文字改写

文字换行

频率分布

文字摘要

词干算法

约束搜索

numpy数值计算要点串讲

Pandas数据处理串讲

python统计图表展示

重要的库

jieba库简介

关键词提取

关键词任务概述

TF-IDF算法原理

相似文章推荐原理介绍

实例:红楼梦文本分析的实现

文件与词库的读取

完成分词与词云图的绘制

文本分类

新闻素材介绍

新闻内容的关键词提取

词向量转化与ngram模型

朴素贝叶斯算法完成新闻分类

文本聚类

语料的加载,文本特征的提取,利用聚类算法对文本进行聚类

主题模型,情感分析

(时间允许)增加主题模型,情感分析部分


报名时间2024-02-28 00:00 至 2024-04-13 00:00
培训时间2024年4月20-21日(两天)
培训地点远程直播,提供录播回放+独家资料+授课老师答疑
培训费用3000元,提供电子版发票+通知+结业证书
授课安排9:00-12:00; 14:00-17:00; 答疑


【授课老师】

陈远祥,北京邮电大学副教授。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。主要研究方向包括光无线融合技术,智能信号处理,以及基于人工智能的信号处理技术。发表SCI/EI学术论文80余篇,其中第一或通讯作者论文40余篇,申请发明专利4项。主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,PhotonicsJournal,Applied Optics等多个SCI期刊审稿人。


【课程大纲】

1. 文本分析概述

   1.1 自然语言处理的层次

   1.2 自然语言处理的难点

   1.3 自然语言处理的流派


2. 文本分析关键技术

   2.1 常用文本整理和清洗方法

       2.1.1 句子拆分

       2.1.2 词拆分

       2.1.3 过滤重复的单词

       2.1.4 删除停用词

       2.1.5 拼写检查

       2.1.6 大小写变换

       2.1.7 文本翻译

       2.1.8 词干提取

       2.1.9 提取电子邮件或URL

   2.2 中文分词技术

       2.2.1 规则分词

       2.2.2 统计分词

       2.2.3 混合分词

       2.2.4 实战:结巴分词,对爬取的豆瓣数据分析,统计词频,绘制词云图

   2.3 词性标注与命名实体识别

       2.3.1 词性标注

       2.3.2 命名实体识别

       2.3.3 实战:基于jiebaku 的词性标注和基于HanLP的命名实体识别

   2.4 文本向量化

       2.4.1 离散化表示

       2.4.2 分布式表示

       2.4.3 实战:利用word2vec计算西游记中人物相似性

   2.5 关键词提取

       2.5.1 TF-IDF算法

       2.5.2 TextRank算法

       2.5.3 LDA算法

       2.5.4 实战:基于LDA主题模型进行新闻关键词提取

       2.5.5 实战:网页相似性分析

   2.6 文本分类

       2.6.1 分类算法介绍

       2.6.2 实战:贝叶斯新闻分类

       2.6.3 实战:虚假评论分类

   2.7 文本聚类

       2.7.1 kmeans算法介绍

       2.7.2 实战:百度百科数据聚类

       2.7.3 实战:豆瓣书籍数据聚类

   2.8 文本情感分析

       2.8.1 基于规则的情感分析

       2.8.2 基于机器学习模型的情感分析

       2.8.3 实战:基于豆瓣电影的情感分析

       2.8.4 实战:在线情感分析系统


【联系方式】

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu

JGxueshu.jpg

课程订阅

讲师介绍


Peixun.net

Python师资培训-文本分析

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

Python师资培训-文本分析

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说
联系顾问 顾问微信

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去