搜索
查看: 3955|回复: 0

[资源分享] 用R分析问卷数据、撰写报告案例分享(一)

[复制链接]

5

主题

1

回帖

151

积分

注册会员

积分
151
发表于 2016-7-31 20:35:55 | 显示全部楼层 |阅读模式

【企业客户之声系列——ReproducibleResearch】
        每每接到调查咨询项目时,数据处理和分析的工作总会用掉大量的时间,虽然EXCEL玩得倍儿溜,SPSS也十分熟练,但庞大的数据处理过程和重复的操作仍会让人觉得难以消化,而且数据一旦出现差错,前面所有的工作都得推翻重来。
        导师深以为意,给小编指了一个方向,可重复研究——即用Rmarkdown写文档,插入可执行数据分析的R代码、图片或网站链接等,一键knitr批量产生可重复研究的报告文档。

这段时间小编一直在这个方向摸索学习,今天和大家分享一个简单的案例撰写过程。限于文章篇幅,今天只分享数据处理和分析的基本操作,下篇小编会专门讲解Rmarkdown写报告的过程。
一、工具准备
工具准备:R及Rstudio。
包准备:memisc,vcd
二、R实现步骤
1)读取数据文件
2)定义标签、重编码
3)基本统计分析
4)简单图形绘制
5)Rmarkdown撰写报告
三、实战
本文使用数据集截取自@客户满意度咨询项目数据。

通常调研获取的数据是录入到Excel表里的,在使用R读取数据时,需要先将其转换成.csv格式。注:公司旗下A-WEB“雅典娜”网络调查系统,可以完成问卷制作与发放、数据采集(自动录入系统)、数据导出(包含.xls、.csv、.sav(SPSS)等多种格式)。

1)读取数据文件
#加载包
library(memisc)
library(vcd)
#读取数据
mydata<-read.csv(file= file.choose())
mydata<-as.data.set(mydata)
Str(mydata)
2)定义标签、重编码
#定义标签、重编码
attach(mydata)
mydata<-within(mydata,{
  description(Q1)="选择XX的主要因素"
  description(Region)<-"大区"
  labels(Q1)<-c(
    "XX品牌"=1,
    "产品质量"=2,
    "产品价格"=3,
    "产品可扩展性"=4,
    "产品配套服务"=5,
    "技术领先性"=6,
    "服务质量"=7,
    "其他"=8
  )
  labels(Region)<-c(
    "东北大区"=1,
    "华东大区"=2,
    "华南大区"=3,
    "华中大区"=4,
    "西南大区"=5
  )
})
#查看已编码数据
labels(mydata$Q1)


#codebook函数完成基本描述统计分析
codebook(mydata$Q1)


3)基本统计分析
options(digits =2)#显示两位小数点
#单变量分析,求频数、百分比、
counts1<-table(mydata$Q1)
c1<-counts1/sum(counts1)*100
#memisc包提供percent函数可直接求出百分比
#d1<-percent(mydata$Q1) 结果可自行比对
#排序
c1<-c1[c(order(c1))]
#交叉表分析
mytable<-xtabs(~Q1+Region,data=mydata)
#求百分比
prop.table(mydata,2)*100

4)简单图形绘制
#绘制条形图
par(las=2)#旋转坐标轴标签
#旋转条形图,上色
x<-barplot(c2,main="选择XX的主要因素",horiz=T,cex.names=0.6,col=rainbow(8))

#添加数值标签-pos设置不同标签位置
lbls1<-paste(c2[1:5],"%",sep="")
lbls2<-paste(c2[6:8],"%",sep="")
text(c2[1:5],x[1:5],labels=lbls1,cex=0.6,pos=4)
text(c2[6:8],x[6:8],labels=lbls2,cex=0.6,pos=2)


#加边框
box()


   
总结
         R需要写代码让很多人望而生畏,但对于问卷数据所使用到的函数是非常简单的,且可重复研究的目的就在于设置好分析框架,只需更换数据,就能批量产出所需报告,这一点在接下来的Rmarkdown的使用中会做展示。如果您始终为代码头疼而放弃它的美妙之处,没关系,公司正致力解决代码编写工作,给您提供一个基于“可重复研究”技术的一键式报告平台,敬请期待。
注:
商智通(www.bistone.com)面向企业推出的客户之声(webvoc)解决方案,是基于大数据技术,帮助组织各层倾听客户之声,实现对客户需求、客户满意和客户忠诚进行自动数据采集、分析、预警和改善的一站式平台,可有效提升客户体验管理水平、支持企业内部快速反馈和改善服务质量、助力企业打造粉丝经济,从而大幅提升销售额和利润率。
商智通(www.bistone.com)研究的通用客户满意度指数测评模型(UCSI),有效帮助客户企业提升客户满意度,改善客户体验。目前已经在电信行业(TCSI)、旅游行业(游客满意度指数)、保险行业(保险客户满意度指数)、物流行业(物流客户满意度指数)、高等教育行业(高校毕业生就业满意度指数)、石化行业(石化行业ToB、ToC业务客户满意度指数)、银行业(银行客户满意度指数和)、地产行业(地产中介客户满意度指数、业主满意度指数)等等多个行业成功应用。

北京商智通信息技术有限公司

营销服务中心地址:北京市海淀区长远天地大厦B1座17层

研发总部地址:北京市海淀区红山口甲1号

山东研发中心地址:山东淄博高新区政通路135号高科技创业园B座4层

广州研发中心地址:广州科学城科学大道广州国际企业孵化器A区11层

总机:010-82128818

全国咨询热线:400-082-3600

网址:http://www.bistone.com



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-3-29 15:35 , Processed in 0.070626 second(s), 25 queries .

快速回复 返回顶部 返回列表