分类菜单
软件开发
培训首页> 北京培训> 软件开发培训课程> Python网络爬虫及数据采集技术”培训
Python网络爬虫及数据采集技术”培训
移动客户端下载:

Python网络爬虫及数据采集技术”培训

参考价格: 电话咨询
咨询电话: 400-656-1390
立即预约 确认报名
姓名3:
电话:
城市:
想学
什么:
Python网络爬虫及数据采集技术”培训
课程说明
课程级别
入门级
培训周期
一周以内
上课地址
北京海淀中关村958楼中科天博
【课程详情】

  关于举办“Python网络爬虫及数据采集技术”培训的通知

  各有关单位:

  中国科培训中心计算技术研究所是专门的计算技术研究机构,同时也是中国信息化建设的重要支撑单位,中科院计算所培训中心是致力于高端IT类人才培养及企业内训的专业培训机构。中心凭借科培训中心的强大师资力量,在总结多年大型软件开发和组织经验的基础上,自主研发出一整套课程体系,其目的是希望能够切实帮助中国软件企业培养软件技术人才,提升整体研发能力,迄今为止已先后为培养了数万名计算机专业人员,并先后为数千家大型国内外企业进行过专门的定制培训服务。

  Python是一种面向对象、解释型计算机程序设计语言,Python是纯粹的自由软件,源代码和解释器CPython遵循 GPL协议。是一个用于统计计算和统计制图的工具,也是GNU的一个免费、源代码开放的软件。

  Python语法简洁清晰,具有丰富和强大的库,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。 Python爬虫包括一套完整的数据采集、处理、计算系统,简便而强大的编程语言,可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。

  本培训将对基于Python爬虫进行数据采集、处理、数据分析的方法深度剖析,并对Python爬虫原理及实现进行讲解。

  一、培训对象

  1,系统架构师、系统分析师、程序员、开发人员。

  2,牵涉到网络采集、处理和规划的负责人、设计人员。

  3,政府机关,金融保险、移动等以互联网信息为数据来源单位的负责人。

  4,高校、科研院所牵涉到网络数据采集与数据处理的项目负责人。

  二、学员基础

  1,对IT系统设计有一定的理论与实践经验。

  2,具备信息检索IR和大数据处理的基础知识。

  3,有一定的python基础知识和开发经验。

  三、师资

  由业界知名云计算亲自授课:

  杨老师 主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个和省部级基金项目,具有丰富的工程实践及软件研发经验。

  四、培训内容

  讲 网络爬虫基础

  1.什么是网络爬虫

  2.浏览网页的过程

  3.URL的含义

  4. 环境的配置

  第二讲 Python爬虫基础知识

  1.Python爬虫基础学习

  2.Python urllib和urllib2 库的用法

  3.Python 正则表达式

  4.BeautifulSoup简介

  5.爬虫框架Scrapy

  第三讲 Urllib库的基本使用

  1.网页爬取示例

  2.网页爬取方法

  3.构造Requset

  4.POST和GET数据传送

  第四讲 Urllib库的用法

  1.设置Headers

  2. Proxy()的设置

  3.Timeout 设置

  4.HTTP的PUT和DELETE方法

  5.使用DebugLog

  第五讲 正则表达式

  1.了解正则表达式

  2.正则表达式的语法规则

  3.正则表达式相关注解

  4.Python Re模块

  第六讲 Beautiful Soup的用法

  1. Beautiful Soup的简介

  2. Beautiful Soup 安装

  3. 创建 Beautiful Soup 对象

  4. Beautiful Soup对象种类

  5. 遍历文档树

  第七讲 开始采集

  1.遍历单个域名

  2.采集整个网站

  3.通过互联网采集

  4.用Scrapy采集

  5.几个示例

  第八讲 存储数据和读取文档

  1.媒体文件

  2.把数据存储到CSV

  3.MySQL与Python整合

  4.读取纯文本和CSV文档

  5.读取Word和.docx

  第九讲 自然语言处理基础

  1.概括数据

  2.马尔可夫模型

  3.自然语言工具包

  4.用NLTK做统计分析

  5.用NLTK做词性分析

  第十讲 用爬虫测试网站

  1.测试简介

  2.Python单元测试

  3.Selenium单元测试

  4.Python单元测试与Selenium单元测试的选择

  五、培训目标

  1,了解Python爬虫的相关知识。

  2,学习Python爬虫的核心技术方法以及应用特征。

  3,深入使用Python在网络数据采集中的使用。

  六、培训时间、地点

  时间: 2017年7月20日-7月21日 地点:北京

  七、证 书

  培训结束,颁发中科院计算所职业培训中心“Python网络爬虫及数据采集技术”结业证书。

  八、费 用

  培训费:5500元/人(含教材、证书、午餐、学习用具等)。住宿协助安排,费用自理。


以上就是软件开发培训课程的全部内容介绍,如需了解更多的软件开发培训班、课程、价格、试听等信息,也可以点击进入 软件开发 相关频道,定制专属课程,开始您的学习之旅。

课程内容以实际授课为准
  • 软件开发
  • 软件测试
  • 数据库
  • Web前端
  • 大数据
  • 人工智能
  • 零基础
  • 有HTML基础
  • 有PHP基础
  • 有C语言基础
  • 有JAVA基础
  • 其他计算机语言基础
  • 周末班
  • 全日制白班
  • 随到随学

温馨提示

个性定制课程


温馨提示