推荐非理工科同学学习python

程序语言从fortran、lisp开始算有近60年的历史了,现代程序语言早已不是人们之前影响中拥有高深数学功底的工科男才能掌握的技能。以python为例,其拥有良好的强制编码风格,广泛的第三方包和适当的高层语法环境*。非常适合非理工科同学学习。尤其是中国人民大学这所以经管类学科见长的学校更应该为经管类学生开设python应用基础及其数据分析方法课程。

但是现在情况如此,而且以实验室名义开设也是前景未知。这里推荐大家学习三本O`reilly的三本动物书,以便自学:

Learning Python (作为入门可以只看前15章)
Web Scraping with Python(作为入门可以只看前7章)
Python for Data Analysis

以上三本书都有中文版。

英文好的同学可以参照 coursera 的 Programming for Everybody (Getting Started with Python)学习。

注*这里高级不是比哪个语言高级,没有高低比较。程序语言越靠近汇编语言,语法层级越低,越靠近自然语言。语法层级越高。这里指python的语法层级适当,适合无计算机学科人学习,又不损害其语法效率。

debian的sources.list编写规则

以debian8自带sources.list为例

deb http://ftp.debian.org/debian/  jessie-updates main contrib
deb-src http://ftp.debian.org/debian/  jessie-updates main contrib

分为四部分
1 deb deb-src
2 http://ftp.debian.org/debian/
3 wheezy-updates
4 main contrib

使用清华镜像源替换为例
1 deb deb-src不变
2 网站地址替换http://mirrors.6.tuna.tsinghua.edu.cn/debian/
3 点开镜像下dists目录,此例中点开http://mirrors.6.tuna.tsinghua.edu.cn/debian/dists/,显示如下

Debian6.0.10/
Debian7.8/
Debian8.0/
experimental/
jessie/
jessie-backports/
jessie-kfreebsd/
jessie-kfreebsd-proposed-updates/
jessie-proposed-updates/
jessie-updates/
oldoldstable/
oldoldstable-proposed-updates/
oldoldstable-updates/
oldstable/
oldstable-backports/
oldstable-backports-sloppy/
oldstable-proposed-updates/
oldstable-updates/
proposed-updates/
rc-buggy/
sid/
squeeze/
squeeze-lts/
squeeze-proposed-updates/
squeeze-updates/
stable/
stable-backports/
stable-kfreebsd/
stable-kfreebsd-proposed-updates/
stable-proposed-updates/
stable-updates/
stretch/
stretch-proposed-updates/
stretch-updates/
testing/
testing-proposed-updates/
testing-updates/
unstable/
wheezy/
wheezy-backports/
wheezy-backports-sloppy/
wheezy-proposed-updates/
wheezy-updates/
README

以上dists下显示的为部分3可填写内容。常用如下stable/ 为当前稳定,testing/为当前测试,sid/为当前不稳定。这三个稳定性一次递减。其余具体请访问www.debian.org 或者google学习。

4 点开前表相应链接,以jessie/为例

../
contrib/
main/
non-free/
ChangeLog
InRelease
Release
Release.gpg

前几个文件夹即为部分4内容,一般情况下为 contrib main non-free 以空格隔开(可能还有non-us等文件夹,以空格隔开填写即可。意义这里不在累述)

同时sources.list以#为注释符,可以设计多个源,以便切换。这里有大量的细节内容没有补充,特别是分部3的各个的意义和范围,内容很多,这里不再累述,请自行学习。

人大校内debian镜像推荐

人大校内推荐两个镜像地址:

1 北京理工大学 http://debian.bjtu.edu.cn/
优点:速度非常快(11年的时候ipv6下载速度达到300m/s,你没有看错)。
缺点:不稳定,经常莫名的无法访问。(以前联系过管理员,好像只是一个人在维护,精力有点不够。)

2 清华大学 http://mirrors.6.tuna.tsinghua.edu.cn
优点:非常稳定
缺点:四平八稳

顺带分析一下镜像内容
一般情况:debian文件夹下是各软件包,debian-cd或者debian-release是分发光盘镜像,debian-security是服务器专用安全软件源。

中华人民共和国环境保护部API历史数据

中华人民共和国环境保护部API历史数据,从2000年6月5日至2013年12月31,总计381030条.。目前API已被AQI替代,为了方便统计口径一直,有些时候还是需要API历史数据。

数据样例:381030;烟台;2000-06-05;145;可吸入颗粒物;Ⅲ1;轻微污染

下载地址:http://pan.baidu.com/s/1kUWnvhX(原有链接丢失,重新更新链接,db文件请用sqlite3打开)

注:此数据为本实验室基于科研目的从中华人民共和国环境保护部公开网页抓取,请仅用于科研目的。如有版权方质疑,请尽快联系本实验室删除下载。

实验室使用及成果发文标注备忘

 

一、 实验室借用方法:

实验室全部资源(包含客户端及服务器等)无偿的提供于校内外师生、学者用于与学术相关的数据生成及采集用途。使用后需按“实验室使用后成果发文标注要求”对相关成果进行标注。

非学院师生借用实验室需所在单位出具借用人本人签字并加盖公章的介绍信(内容因包括姓名,单位,及所做实验或者用途的简要说明)。

其他具体借用事宜请与实验室网站管理员联系。

 

二、实验室使用后成果发文标注要求:

1 仅使用实验室硬件设备即场所,请注明: 感谢中国人民大学经济学院实验室为数据采集提供了帮助。

2 如使用了实验室的硬件设备、场所及实验招募人员,请注明:感谢中国人民大学中国人民大学经济学院实验室为数据采集提供了资源支持。

3 如果寻求实验室提供计算方法或其他技术支持,请注明:感谢中国人民大学经济学院实验室为数据采集提供了技术支持。

4 如果实验室参与了数据采集或者计算的设计及其他论文发布主体内容:请以中国人民大学经济学院实验室或实验室成员为追加作者。

如有特殊情况致使不包含以上标注要求或者无法实现,请与实验室管理员联系。

 

 

2011年5月30日

经济学院实验室

 

尝试抓取“中国环境监测总站”空气质量实施数据

目前来看无法进行。
首先尝试数据包抓取。翻阅了先驱们的文献,数据包抓取卡在这里:很可能服务器传回数据经过加密。
其次尝试反编译,使用reflector,轻松反编译。但是在大量的C#语句前了。完全看不懂,没有人任何的可读性。
尝试就此放弃以后再说吧。

PS:抓取中国环境保护部数据中心的每日数据目前来看还算正常,进度有一半了,下周就可以完成。