高一信息技术必修一《数据与计算》复习提纲
第一章数据与信息
1.1数据及其特征
- 数据的概念 数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。
- 数据的表现形式: 图形、图像、视频、音频、文本(文字、数字、数值、字符)等数值型和非数值型符号。
- 数据的基本特征 (1)二进制。在计算机中,数据以二进制的形式存储、加工。 (2)语义性。语义是将数据符号解释为客观世界的事物。 (3)分散性。数据是分散的记录,分别记录不同客观事物的运动状态。 (4)多样性和感知性。数据记录的形式是多样的、可看的、可听的、可感知的,如图形、图像、视频、音频、文本等。
1.2数据编码
模拟信号: 模拟信号是指用连续变化的物理量所表达的信息。模拟信号是传导能量的一种方式,其幅度、频率或相位随时间作连续变化。 常见的模拟信号应用:有线相连的电话和无线发送的广播电视。
数字信号: 数字信号是离散时间信号的数字化表示。在计算机中,数字信号的大小常用有限位的二进制数表示。 常见的数字信号应用:开关电路中输出电压和电流脉冲的信号。
模拟信号与数字信号优缺点对比
| 名称 | 优点 | 缺点 |
|---|---|---|
| 模拟信号 | 简单容易实现 | 保密性差,抗干扰能力弱 |
| 数字信号 | 抗干扰能力强,保密性、可靠性强 | 技术实现复杂,占用频带宽 |
文字编码——ASCII码、国标码、统一码 ASCII码:英文字母A的编码为01000001(十进制数65)和a的编码为01100001(十进制数97),后面的字母依次往上加1。
进制换算
- 二进制:0 1
- 八进制:0 1 2……7
- 十进制:0 1 2……9
- 十六进制:0 1 2……9 A B C D E F 二进制→十进制:1011=1×2^0+1×2^1+0×2^2+1×2^3=11 八进制→十进制:101=1×8^0+0×8^1+1×8^2=72 十六进制→十进制:1B=11×16^0+1×16^1=27 二进制→八进制:(三个二进制数为一个整体)101=5 二进制→十六进制:(三个二进制数为一个整体)1011=B 十进制→二进制:(除二求余倒排法)
图像编码 位图,是指用二进制数(0和1)表示的图像。最小单位为光栅点(或称像素),也叫作点阵图(或像素图)。 位图数据文件大小=图像分辨率×图像量化位数÷8(单位:B)
声音编码 声音编码的三部曲:采样、量化、编码。 声音存储空间=采样频率×量化位数×声道数×时间÷8(单位:B)
信息及其特征
信息的概念 是经过加工处理、具有意义的数据。是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征。
信息的特征(结合案例) (1)普遍性:信息不是虚无缥缈的事物,只要有事物运动,有数据存在,就会有信息存在。信息普遍存在于自然界和人类社会发展的始终,可以被人们感知、获取、传递和利用。 (2)传递性:信息的传递打破了时间和空间的限制; (3)共享性:信息作为一种资源,通过交流可以在不同的个体或群体间共享; (4)依附性和可处理性:各种信息必须依附一定的图像、文字、声音等符号才能够表现出来,为人们所接收,并按照某种需要进行处理和存储。信息经过分析和处理,往往会产生新的信息,使信息得到增值。 (5)时效性:信息不是一成不变的东西,会随着客观事物的变化而变化。如果信息不能反映事物的最新变化状态,它的效用就会降低,一旦超过其“生命周期”,信息就会失去原有的效用,成为历史记录。例如新闻,通知,天气预报、情报、红绿灯等。 (6)真伪性:并非所有信息都是对事物的真实反映。 (7)价值相对性:信息的使用价值的大小是相对的,取决于接收信息者的需求及其对信息的理解、认识和利用的能力;
第二章 知识与数字化学习
2.1 知识与智慧
知识概念: 知识是人们运用大脑对获取或积累的信息进行系统化地提炼、研究和分析的结果,能够精确地反映事物的本质。它来源于实践、经过加工提炼,又高于实践。
智慧概念: 智慧是为了达到预定目标而运用知识解决问题的创新思维能力。
数据、信息、知识、智慧的关系 数据、信息、知识和智慧是一个逐级提升的概念体系:
- 数据是原始的符号和事实,没有经过加工和解释
- 信息是经过加工处理后,具有一定意义的数据
- 知识是对信息进行系统化提炼、研究和分析的结果,能够精确反映事物本质
- 智慧是运用知识解决问题的创新思维能力
它们之间的转化关系:数据 → 加工处理 → 信息 → 系统化提炼 → 知识 → 创新应用 → 智慧

2.2 数字化学习与创新
- 数字化工具分类:
- 硬件工具:计算机、平板电脑、智能手机、电子白板、扫描仪等
- 软件工具: (1)信息获取工具:搜索引擎(如百度、Google)、网络爬虫 (2)信息加工工具:文字处理软件(Word)、电子表格软件(Excel)、图像处理软件(Photoshop) (3)信息呈现工具:演示文稿软件(PowerPoint)、思维导图软件(XMind) (4)交流协作工具:即时通讯软件(微信、QQ)、视频会议软件(腾讯会议)、云存储平台(百度云、Dropbox)
数字化工具与资源的优势 (1)获取的便捷性。 (2)形式的多样性。 (3)资源的共享性。 (4)平台的互动性。 (5)内容的扩展性。(表现为:可操作性和可再生性)
数字化学习的特点 (结合案例) (1)问题化 (2)合作性(3)个性化(4)创造性和再生性 (5)开放性
常见的思维导图软件:XMind Mindmanager FreeMind
第三章 算法基础
3.1体验计算机解决问题的过程
- 计算机解决问题过程:分析问题、设计算法(核心)、编写程序、调试运行、检查结果
3.2 算法及其描述
算法的概念
算法就是解决问题的具体方法和步骤。算法的特征: (1)有穷性 (2)确定性 (3)数据输入(0个或多个)(4)数据输出(1个或多个)(5)可行性
算法的描述方式: (1)自然语言 (2)流程图 (3)伪代码
流程图基本图形及功能
图 形 名 称 功 能 
开始/结束 表示算法的开始或结束 
输入/输出 表示算法中变量的输入或输出 
处理 表示算法中变量的计算与赋值 
判断 表示算法中的条件判断 三种基本控制结构: (1)顺序结构 (2)选择结构(分支结构)(3)循环结构
3.3 计算机程序与程序设计语言
计算机程序概念: 计算机程序就是指计算机可以识别运行的指令集合。
计算机组成: 计算机系统由硬件系统和软件系统两大部分组成: (1)硬件系统:包括中央处理器(CPU)、存储器(内存、外存)、输入设备(键盘、鼠标等)和输出设备(显示器、打印机等) (2)软件系统:包括系统软件(操作系统、语言处理程序、数据库管理系统等)和应用软件(办公软件、游戏软件等)
计算机程序运行过程: (1)编译阶段:将高级语言编写的程序(源代码)通过编译器翻译成计算机可执行的机器语言程序(目标代码) (2)运行阶段:将目标代码加载到内存中,由CPU按顺序执行指令

计算机语言发展历程和特点 (1)机器语言 机器语言是最早出现的语言,是用二进制代码(0、1)作为指令编写,可以在硬件上直接运行,运行效率最高,编写程序的效率最低,程序移植性最差,对硬件依赖程度最高。 (2)汇编语言 使用类似英文缩略词且带有助记性符号的语言。如:用ADD表示加法,MOV表示数据传递。汇编语言程序必须借助翻译程序翻译成机器语言程序机器才能运行。 (3)高级语言 它是最接近数学语言和自然语言的。高级语言程序必须经过解释或编译程序翻译成机器语言才能执行。运行效率最低,编写效率最高,移植性最好。
常见的高级语言:
第一种高级语言是Fortran语言,它主要用于科学和工程计算。ALGOL、COBOL、Basic、LISP、SNOBOL、Pascal、C、C++、PROLOG、Ada、VC、VB、Delphi、Java、Python。
第四章 程序设计基础
4.1 程序设计语言的基础知识
变量的命名规则 (1)标识符由字母、数字和下划线组成。并且第一个字符必须是字母或下划线。 (2)标识符是区分大小写的,如X和x、sum和Sum都是不同的标识符。
Python常用的基本数据类型
(1)Number(数值):int(整型)、float(浮点型) (2)String(字符串):字符串是以单引号或双引号括起来的文本。字符串的索引从0开始,-1 为从末尾开始的位置。(3)List(列表) 写在方括号[]之间,并用逗号来分隔元素的就是列表。 (4)Tuple(元组) 写在小括号()之间,并用逗号来分隔元素的就是元组。元组的元素不能修改. (5)Sets(集合) 集合是一个无序不重复元素的序列。可以使用大括号{ }或者set( )函数创建集合. (6)Dictionary(字典) 字典是无序的对象集合,需要通过键来存取,因此用{ }标识,是无序的“键(key):值(value)”对集合。例如zidian=Python常用的运算符 (1)算术运算符
运算符 功能 作用 +加法 两个数相加 -减法 第一个数减去第二个数 *乘法 两个数相乘 /除法 第一个数除以第二个数,结果为浮点数 //整除 第一个数除以第二个数,结果取整数部分 %取模 第一个数除以第二个数,结果取余数 **幂运算 第一个数的第二个数次幂
(2)逻辑运算符
| 运算符 | 功能 | 作用 |
|---|---|---|
and | 逻辑与 | 如果x为False,返回False,否则返回y的计算值 |
or | 逻辑或 | 如果x为True,x or y返回x的值,否则返回y的计算值 |
not | 逻辑非 | 对布尔值进行取反操作 |
(3)关系运算符
| 运算符 | 功能 | 作用 |
|---|---|---|
<= | 小于等于 | 判断左边的值是否小于或等于右边的值 |
>= | 大于等于 | 判断左边的值是否大于或等于右边的值 |
== | 等于 | 判断两个值是否相等 |
!= | 不等于 | 判断两个值是否不相等 |
(4)运算符的优先级P71
- Python常用函数 P71--72 | 函数 | 功能 | 作用 | | :---: | :---: | :---: | |
abs(x)| 绝对值 | 返回x的绝对值 | |len(x)| 长度 | 计算变量x的长度 | |min(x)| 最小值 | 返回序列x中的最小值 | |max(x)| 最大值 | 返回序列x中的最大值 | |sum(x)| 求和 | 计算序列x中所有元素的和 | |int(x)| 类型转换 | 将变量x转换为整型 | |float(x)| 类型转换 | 将变量x转换为浮点型 |
4.2 运用顺序结构描述问题求解问题
- 输入函数:
input()返回结果都是字符串型。 - 输出函数:
print() - print()函数参数格式化 (1)格式化输出整数(integer):
"%d" % 变量名(2)格式化输出浮点数(float):"%f" % 变量名(3)格式化输出字符串(string):"%s" % 变量名例子:
print("%.3f" % a) # "%.3f"意味着3位小数4.3 运用选择结构描述问题求解问题
- 单分支结构:
if 条件表达式: 语句A - 双分支结构:
if 条件表达式: 语句A else: 语句B - 多分支结构:
if 条件表达式1: 语句1 elif 条件表达式2: 语句2 …… elif 条件表达式N: 语句N else: 语句N+1
4.4 运用循环结构描述问题求解问题
- for循环 (1)格式:(2)使用range()函数 注:range()函数不包含第二个数值。 例1.
for 循环变量 in 可迭代对象: 语句或语句组for value in range(1, 6): # 不包含6例2.for value in range(2, 11, 2): # 指定步长为2例3.for value in range(10, 1, -2): # 降序
例4:计算s=1+2+3+……+100 (1)用for循环python s = 0 for i in range(1, 101): s = s + i print("s=", s) - while循环 (1)格式:(2)使用while循环计算s=1+2+3+……+100
while 条件表达式: 语句或语句组pythons = 0 i = 1 while i <= 100: s = s + i # 累加器 i = i + 1 # i自增1,i指向下一个数。 print("s=", s) # i自增1,i指向下一个数。 print("s=",s)
第五章 数据处理和可视化表达
5.1 认识大数据
- 大数据概念: 大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
- 大数据特征P102 (1)从互联网产生大数据的角度来看: ①数据体量巨大。②数据类型繁多。③价值密度低。④变化速度快。 (2)从互联网思维的角度来看: ①样本渐趋于总体;②精确让位于模糊;③相关性重于因果。 (3)从大数据存储与计算的角度来看: ①分布式存储;(大数据存储在互联网不同的服务器与各客户终端。) ②分布式并行计算。(应用分布式并行计算处理互联网的大数据。)
- 大数据对日常生活的影响 (1)大数据使人们日常生活更为便捷; ①方便支付;②方便出行;③方便购物与产品推介;④方便看病与诊病。 (2)大数据对人们日常生活产生的负面影响: ①个人信息泄露;②信息伤害与诈骗。
5.2 数据的采集
- 数据采集的基本方法: ①系统日记采集法;②网络数据采集法;③其他数据采集法。
- 系统日记P104 (1)概念:是记录系统中硬件、软件和系统问题的信息文件。 (2)系统日记包括:操作系统日记、应用程序日记和安全日记。
- 网络数据采集法 (1)概念:是指通过网络爬虫或网站公开的API(应用程序接口)等方式从网站上获取数据信息。
- 数据的存储: (1)把数据存在本地内部;(2)把数据放在第三方公共或私有的“云端”存储。
- 数据的保护 (1)数据安全保护技术:拷贝/FTP、备份、复制技术、镜像技术、持续备份。 (2)数据的隐私保护 解决方法:①技术手段;②提高自身的保护意识;③要对数据使用者进行道德和法律上的约束。
5.3 数据的分析
(1)特征探索、关联分析、聚类与分类、建立模型和模型评价。
5.4 数据的可视化表达
数据可视化表达工具: (1)Matplotlib(绘图工具模块) (2)Seaborn统计模型的可视化 (3)Bokeh实现交互式可视化
第六章 人工智能及其应用
6.1 认识人工智能
- 典型的智能问答系统主要包括:常见问题解答(FAQ)、问题理解、信息检索、文档库、答案抽取五大模块。 (1)FAQ库:主要用于提高智能问答系统的效率,其主要技术就是问句相似度计算和候选问句的选择。 (2)问题理解模块:实现过程:问题预处理、问题分类、关键词提取和关键词扩展等。 (3)信息检索模块:主要是从互联网或者知识库中找到与问题相关的文档作为答案提取的原材料。 (4)文档库模块:存放专家提供的知识。
- 人工智能发展历程分为三个阶段 (1)起步发展期(1956-1976年):人工智能概念首次提出,主要研究逻辑推理和问题求解 (2)应用发展期(1977-2006年):专家系统、机器学习等技术开始应用 (3)深度学习驱动期(2007年至今):大数据和深度学习技术推动人工智能快速发展
6.2 人工智能的应用
- 智能制造:智能装备、智能工厂、智能服务
- 智能家居:智能音箱、智能家电、智能安防系统
- 智能教育: 智能辅导、个性化学习、智能评分系统
- 智能交通:自动驾驶、智能交通信号灯、交通流量预测
- 智能安防:人脸识别、智能监控、异常行为检测
- 智能医疗:医学影像分析、辅助诊断、药物研发
- 智能物流:智能仓储、路径优化、自动化分拣
附录:计算机基础知识补充

CPU:中央处理器,由运算器、控制器和寄存器组组成,是硬件中的核心配件
- CPU+内存=主机
- CPU的主要性能指标:主频、核心数、缓存大小等
计算机内的容量换算:
- 基本单位:B(字节)
- 最小单位:b(位)
- 换算关系:1TB=1024GB、1GB=1024MB、1MB=1024KB、1KB=1024B、1B=8b
世界第一台电子计算机:
- 1946年,美国宾夕法尼亚大学
- 名称:ENIAC(电子数字积分计算机)
- 特点:使用电子管作为主要元件,体积庞大,功耗高
操作系统:
- 定义:管理计算机硬件与软件资源的程序,是计算机系统的核心系统软件
- 常见操作系统:Windows、macOS、Linux、Android、iOS
- 主要功能:进程管理、内存管理、文件系统管理、设备管理、用户接口
计算机网络基础知识:
- 定义:将多台计算机通过通信设备和传输介质连接起来,实现资源共享和信息传递的系统
- 分类:按覆盖范围分为局域网(LAN)、城域网(MAN)、广域网(WAN)
- TCP/IP协议:互联网的核心协议,包括TCP(传输控制协议)和IP(网际协议)
- IP地址:计算机在网络中的唯一标识,分为IPv4和IPv6两种格式
计算机安全:
- 常见威胁:病毒、木马、黑客攻击、数据泄露等
- 防护措施:安装杀毒软件、使用防火墙、定期备份数据、更新系统和软件、注意网络安全