导图社区 stata入门
这是一篇关于stata入门的思维导图,包括导入数据、编辑数据、审视数据、计算器功能、生成新变量、统计分析等内容。
这是一篇关于线性回归的思维导图,包含简单线性回归:进行医院回归命令;多元线性回归:进行多元回归的命令等。
以下介绍了中国特色全国碳市场设计理论与实践,包括基础理论、发展历程、关键问题、重要意义、进本原则、核心思路等。
社区模板帮助中心,点此进入>>
计算机操作系统思维导图
简单介绍MYSQL数据库软件的基本命令
计算机基础知识
.net学习总结
python基础知识点简单总结
序列类型的方法
管理信息系统
Python3.0入门知识思维导图
java 从入门到精通(第四版本)
软考架构设计师
stata入门
导入数据
打开数据编辑器
打开excel数据文件
复制粘贴
选择第一行为变量
file/save,将数据存为stata格式的数据文件,此后可用stata直接打开
打开数据集
点击快捷键open图标
编辑数据
变量的标签(直接使用编辑器编辑)
审视数据
看数据的变量名称、标签等 describe
想看变量s与lnw的具体数据 list s lnw
只看s与lnw的前5个数据 list s lnw in 1/5
通过逻辑关系定义数据集的子集,列出所有满足条件s>=16的数据 list s if s>=16
其他表示关系的逻辑符号 “==”等于 “!=”不等于 (“=”表示赋值)
按照变量s的升序排列 sort s;list 降序排列 gsort -s;list
画图
直方图
histogram s, width(1) frequency
width(1)表示将组宽设为1;frequency表示将纵坐标定为频数
散点图
scatter lnw s
想在散点图上标注出每个点对应于哪个观测值
gen n=_n; scatter lnw s, mlabel(n)
先定义变量n,表示第n个观测值; 然后以变量作为每个点的标签来画散点图
统计分析
看变量s的统计特征
summarize s
显示s的经验累积分布函数
tabulate s
相关系数
pwcorr lnw s expr, sig star(.05)
sig表示显示相关系数的显著性水平(即p值);star(.05)表示给所有显著性水平小于或等于5%的相关系数打上星号
生成新变量
对数
generate lns=log(s)
平方项
generate s2=s^2
互动项
gen exprs=s*expr
根据工资对数计算工资水平w
gen w=exp(lnw)
虚拟变量
gen college=(s>=16)
"( )"表示对括弧中的表达式“s>=16”进行逻辑评估:如果此式为真,则取值为1;如果为假,则取值为0 如果想把定义改为“s>=15”,但是仍用college作为变量名: drop college gen college=(s>=15)
技巧
对于较长的变量名输入较麻烦
直接在变量窗口双击需要的变量
计算器功能
display expression
display log(2) display 2^0.5