跳至内容
近年来,人工智能技术取得了显著进展,尤其是生成式AI的爆发式增长,推动了AI在各个领域的广泛应用。Python作为AI开发的首选语言,因其简洁易读的语法、丰富的库支持以及强大的社区资源,成为学术研究中不可或缺的工具。
在学术研究中,数据量呈指数级增长,传统数据分析方法已难以满足需求。Python凭借其强大的数据处理能力,结合AI技术,能够高效地处理和分析大规模数据
AI技术与经济学、社会科学、医学等多学科的交叉融合不断加深,Python在这些领域的应用也日益广泛。例如,在经济学研究中,Python与Stata结合,用于处理复杂的数据集和进行因果推断。
Python的学习已经被纳入多个国家的教育体系,成为AI教育的重要工具。这为AI技术的未来发展奠定了坚实基础,也使得更多学者能够掌握并应用Python进行学术研究。
Python与AI工具可以高效地解析学术论文,提取关键信息,生成摘要或可视化报告,从而推动学术知识的快速传播和应用。
AI与Python的结合在学术领域已经展现出强大的潜力,并将在未来继续推动学术研究的创新和效率提升。
在AI的助力下,Python学术系列课程的难度瞬间降低,
当Python师资培训遇见AI系列课程也在24年收获了满满的关注和好评~
这个寒假掌握Python爬虫、文本分析与机器学习的前沿应用
Python机器学习遇见AI:30小时
学习方式:在线学习,提供配套资料及授课老师答疑
寒假专属:购买爬虫文本/机器学习赠送Python基础与数据清洗(价值¥1300)
陈远祥,北京邮电大学博士生导师,北京大学博士,北京大学优秀博士后,数据分析与机器学习资深讲师。主要科研方向:数据分析、大数据处理、人工智能。
发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,授权国家发明专利20余项。主持国家自然科学基金面上项目,国家重点研发计划课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。IEEE、OSA会员,多个SCI期刊审稿人。
目标:掌握爬虫基本概念,爬虫基本流程,掌握网页基础知识,学会简单网页制作
4) 爬虫基本流程
目标:掌握正则表达式的用法,学会利用正则表达式进行文本信息提取,掌握常见文本信息存储方法
3) JSON文件存储
目标:掌握两种基本的请求发送方法,通过案例展示,实现单页和多页数据爬取,掌握动态页面爬取方法,掌握模拟登录,IP代理常用方法,实现高效率、大规模的网络爬取
7) 高效代理池的维护
目标:通过案例,掌握两种高效的网页信息解析和提取方法,实现网络数据的高效提取
6) Xpath的节点选择
目标:通过案例,掌握动态渲染页面的两种自动化的爬虫方法
8) Playwright的常用操作方法
目标:针对验证码反爬虫机制,掌握几种常用验证码识别方法
3) 深度学习识别滑动验证码
目标:掌握scrapy爬虫框架和常用方法,理解分布式爬虫原理
6) 分布式爬虫部署
目标:掌握文本分析的基本概念,文本分析的发展历程,文本分析流程和挑战
6) 文本分析的挑战
目标:掌握文本常用清洗方法,分词原理和方法,词性标注方法
3) 词性标注
目标:掌握文本的常用结构化表示方法,利用多种方法实现文本特征提取,理解每种特征提取的优缺点
6) Doc2vec
3) LDA
目标:掌握文本分析的常见应用,和传统的机器学习方法结合,实现文本的分类,聚类,摘要提取,情感分析等功能
5) 情感分析
目标:掌握最新的深度学习在文本分析中的应用,包括RNN,LSTM,CNN,注意力,Transformer等模型和机制的引入
6) BERT和Transformer
●大模型如何辅助学术研究
●让GPT突破token限制
●定制学术专属GPTs
●利用大模型进行文献信息提取
●大模型辅助进行论文投稿
第二部分:AI大模型辅助机器学习学术应用(24小时)
●如何利用大模型辅助机器学习