7.23.2课程导学
前章回顾
本章要点:
7.23.3集合类型及操作
集合类型及操作
- 集合类型定义
- 集合操作符
- 集合处理方法
- 集合类型应用场景
集合类型的定义
集合是多个元素的无序组合
- 集合类型与数学中的集合概念一致
- 集合元素之间无序,每个元素唯一,不存在相同元素
- 集合元素不可更改,不能是可变数据类型 为什么?
- 集合用大括号{}表示,元素间用逗号分隔
- 集合中每个元素唯一,不存在相同元素
- 集合元素之间无序
集合间操作:
集合处理方法
(返回元素可能顺序不确定)
while也可遍历集合中的元素:
集合类型应用场景
总结:
7.23.4序列类型及操作
序列类型及操作
- 序列类型定义
- 序列处理函数及方法
- 元组类型及操作
- 列表类型及操作
- 序列类型应用场景
序列类型定义
序列类型通用操作符
序列类型操作实例
序列类型通用函数和方法
序列类型操作实例
元组类型及操作
元组类型定义
元组类型操作
列表类型定义
序列类型及操作
列表类型操作函数和方法
列表类型操作函数和方法
列表类型操作
思考以下功能如何实现:
实现:
序列类型应用场景
元素遍历:
序列类型应用场景
总结:
列表是重点!
7.23.5实例:基本统计值计算
问题分析
- 需求:给出一组数,对它们有个概要理解
- 该怎么做呢?
总个数、求和、平均值、方差、中位数。
基本统计值
sorted可对列表进行排序
运行结果:
“基本统计值计算”举一反三
技术能力扩展
- 获取多个数据:从控制台获取多个不确定数据的方法
- 分隔多个函数:模块化设计方法
- 充分利用函数:充分利用
Python
提供的内容函数
7.27.1字典类型及操作
字典类型及操作
- 字典类型定义
- 字典处理函数及方法
- 字典类型应用场景
字典类型定义
字典类型的用法
字典类型定义和使用
字典类型操作函数和方法
列表类型操作函数和方法
字典类型操作
思考如何完成以下操作:
字典类型应用场景
组合数据类型的引入目的:用恰当的关系来表达一组数据进而更好的操作它们。一旦一组数据可以表达成字典类型,我们就可以利用它的键对它进行遍历,具体使用for k in d:<语句块>构成循环,由键逐一地索引它们的值进而进行操作。
总结:
7.27.2模块:jieba
库的使用
jieba
库基本介绍
jieba
库概述:jieba
是优秀的中文分词第三方库
- 中文文本需要通过分词获得单个的词语
jieba
是优秀的中文分词第三方库,需要额外安装jieba
库提供三种分词模式,最简单只需掌握一个函数
jieba
库的安装
jieba
分词的原理
jieba
库的使用说明
jieba
分词的三种模式:
精确模式、全模式、搜索引擎模式
jieba
分词要点:jieba.lcut(s)
它能将字符串s精确地分词处理并且返回一个列表类型。
7.27.3实例:文本词频统计
问题分析:文本词频统计
需求:一篇文章,出现了哪些词?哪些词出现得最多?
其中,倒数第四行使用了列表排序函数。
《三国演义》人物出场统计
代码仍需改造!
将词频与人物相关联,面向问题
文本词频统计举一反三
应用问题的扩展
《红楼梦》、《西游记》、《水浒传》…
政府工作报告、科研论文、新闻报道…
进一步呢?未来还有词云.
版权属于:soarli
本文链接:https://blog.soarli.top/archives/409.html
转载时须注明出处及本声明。