搜索
查看: 3090|回复: 0

[资源分享] 用R做数据分析(1)——R简介

[复制链接]

165

主题

5

回帖

1123

积分

金牌会员

积分
1123
发表于 2014-5-24 03:12:56 | 显示全部楼层 |阅读模式
R语言是由 Ross Ihaka、Robert Gentleman二位创建的,这也许可以解释为什么叫R语言。现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目。一、R语言介绍
R是为统计计算和作图的一门语言和环境。是一个GNU项目,和S语言和环境很相似,S语言是由BELL实验室的John Chambers和他的同事开发的。R语言可以认为是从S语言衍生而来的,他们之前有很重要的不同,但是大多数用S语言写的代码也可以在R中运行。

目前R在高校非常流行,特别是随着这几年互联网的发展,(R在一些大公司的运用得到的实践,例如:国外的google、linkdin、facebook等,国内一些大型互联网公司也在开始使用R),及随着互联网版权的意识增强,也促使了R在互联网的发展。当然R在很多领域都有很广泛的运用。

R语言是开源的,同时可以运行在各种平台上(Linux、Windows、MacOS等)。R的许多软件包是由R语言、 LaTeX、Java及最常用C语言和Fortran撰写。
可以说现在R包含各种各样的功能,可以说目前你能想到的功能,都可以找到一个或者多个R包来实现。几千个R包,哪个才最适合你呢?“最适合你自己的R包,也许就是你自己写的那个包”。

二、 R软件安装下载
CRAN地址:http://www.r-project.org/,什么是CRAN:
CRAN为Comprehensive R Archive Network(R综合典藏网)的简称。它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。现时,全球有超过一百个CRAN镜像站。(来源http://baike.baidu.com/view/942569.htm
根据你的操作系统,下载相应的R语言安装文件。
下载地址:http://ftp.ctex.org/mirrors/CRAN/
        
三、 R语言的特点
1、变量不需要申明即可引用。
2、R语言的核心是:向量。
3、R语言是一个函数语言。
4、向量中的下标是从1开始引用的。
5、R是脚本语言、面像对象;
四、 如何学学习R语言

《R语言学习由浅入深路线图》 这篇文章大家可以参考,这篇文章简单介绍了一下R学习的资料,大家可以根据需要进行参考。那么如何才能学好R,个人理解有以下几点:
1、不要期望你能学会R中所有的包。不要把目标定的那么高。
2、关键能理解R语言的内涵。多看看CRAN上的相关文档,例如:季刊、R语言相关新闻,特别是每次版本更新的一些内容。
3、运用
如果你是做数据分析相关的工作的,一定要把学习到的R语言知识运用到你的工作中,不管你把R语言当用一门编程语言还是统计工具,用的多了,自然你就有感觉,很多东西你就记住了。
4、持续
每天花点时间写几条R代码,实现一些小功能。如果你工作上就用R,那是最完美的。
5、多看
多看别人写的代码,R运用的案例。你可以google一下R会有很多好的博客,文章。很多人都是R的GREEK。
6、开放
一定要开放、分享的心态。多与别人交流,不要总是需求,一定要学习给予。(我是我个人观点,如果要真好用到R,让R发挥价值就是必须的。)
7、总结
学到的东西,及时做好总结,可以总结成案例或者笔记,如果可以欢迎分享给大家(http://www.itongji.cn/member/article_add.php 到这投稿是一个不错的选择)   
五、 我对R语言的理解和看法
随时互联网的发展,特别是互联网对于版权、成本的因素考虑,因为免费、开源使越来越多的公司开始用R语言来处理数据、分析数据、完成模型等,当然这其中也伴随着对于数据价值挖掘的,特别是在大数据的背景下,想通过对数据挖掘&分析建立自己的竞争优势。

R不仅 免费还有各种各样的的功能包资源。从某种程度上讲,任何你想要的功能应该都可以找到对应的包,只是说是否完全满足,对于一些算法研究人员来说,可以在原来的代码的基础进行借鉴。这也许就是为什么R最开始主要用到高校或者学术领域(当然和国外学者、专家这种自由、开放的环境或者意识有很关系,这也许就是为什么许多开源软件都是国外出来,很少看到国内的大公司有什么好的东西开源)。

很多行业人士都说R是未来的“王道”,就像unix的发展过程一样。我觉得未来一定有属于R的一片天空,而且这种天空可以说是接近无限。所以,对于有志于从事数据挖掘、数据分析这个行业的朋友来说,掌握R是也许会成为未来的必备技能(就像现在数据分析师大多要求会:SQL)。
最后,我对R语言的理解与总结可以概括为一句话:“开源、二次加工、分享精神”。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-4-29 09:19 , Processed in 0.078115 second(s), 27 queries .

快速回复 返回顶部 返回列表