李舰,楚人,也是汉人。生于离湖之畔,长于汉水之滨。性情随和,无可无不可。言语偏激,时常发条微博就掉十几个粉。我心中自己的形象是“带长铗之陆离兮,冠切云之崔嵬”,不过现实中肥成中年大叔了。我幼年时的志向是为往圣继绝学,可惜如今投笔从键,成了猥琐的科学青年和理工技术男。弱冠时学统计,而后搞编程,如今大部分的时间都在和数据打交道,这正是“觉宇宙之无穷,识盈虚之有数”。

我的偶像是光武大帝,崇拜过的人有霍去病、陶侃、祖逖、韦睿、孟珙、文天祥、于谦、张居正等。英雄的事迹读史足矣,平时反复研读的是屈子辞、昌谷诗、清真词。另外偏爱稼轩和梅溪,耗时不少。 小时候希望自己能成为一个“上知天文,下识地理,三教九流,无所不晓”的人,也读了一些诸子百家,比较喜欢庄子、孙子和韩非子。民国诸家中我推崇熊十力和马一浮。 因为小学水平太差,读经很少,只是少年时背了一些四书五经的东西。

业余时间兴趣广泛,年轻时爱好集邮、围棋、手工艺、算卦,现在爱好看球、小说、模玩、八卦。 曾经也花了不少时间培养户外、摄影和越野的兴趣,不过在有变成器材党的趋势后就悬崖勒马了。 我是当年那支武汉FC的死忠,被搞没后开始仇视中国足球,成了德国队的粉丝,之前是拜仁球迷, 罗伊斯续约后成了多特球迷。小说喜欢武侠和修仙,很多作品看了不只一遍,每遍都喜爱的只有还珠楼主。 现在最主要的玩具是变形金刚,我是 G1 党和比例党。以前算卦的才能现在变成了八卦,我的消息来源主要是贴吧、微博和新闻联播。

工作中我是新技术的狂热追逐者,哪怕是自己擅长的如果过时了也会毫不留情地痛击,常说“法尚应舍,何况非法”。 实施方面是坚定的结果导向主义者,常说“费那事干嘛”,因此也经常表现为极端的守旧派。直到现在, 我还是更习惯翻书而不是使用搜索引擎、在 R Console 中运行程序、用 Eclipse 和 Notepad++ 写几乎所有代码、用 LaTeX 源码排版以及用 HTML+CSS 写静态网页,现在这个个人网站用HEXO生成静态网页,算是难得的与时俱进了。

教育背景

  • 中国人民大学,统计学院,经济学学士
  • 北京大学,软件与微电子学院,软件工程硕士

书籍出版

  • 数据科学中的R语言

    • 作者:李舰,肖凯
    • 审校:吴喜之
    • 出版社:西安交通大学出版社
    • ISBN:978-7-5605-7082-2
    • 版次:2015年7月第1版
  • R语言核心技术手册(第2版)

    • 作者:[美] Joseph Adler
    • 译者:刘思喆,李舰,陈钢,邓一硕
    • 出版社:电子工业出版社
    • ISBN:978-7-121-23786-7
    • 版次:2014年7月第1版
  • 机器学习与R语言

    • 作者:[美] Brett Lantz
    • 译者:李洪成,许金炜,李舰
    • 出版社:机械工业出版社
    • ISBN:978-7-111-49157-6
    • 版次:2015年3月第1版

会议报告

演讲和报告

  • 2015-08-15,基於開源工具的大數據分析平台,2015大數據論壇-Taiwan,臺北醫學大學,台北
  • 2015-06-27,数据科学与R语言,数据科学与实验教学系列讲座,厦门大学,厦门
  • 2015-05-22,数据科学在业界的应用,金融与统计学院讲座,华东师范大学,上海
  • 2015-04-28,如何成为一个数据科学家,开源力量124期公开课,线上公开课
  • 2015-03-13,统计学在业界的应用,SCMS Seminar,复旦大学,上海
  • 2014-12-22,社群網絡和輿情分析,資訊與決策科學研究所專家課程,國立台北商業大學,台北
  • 2014-05-23,傳統行業裡資料科學的專案介紹,2014資料科學與產業應用研討會,東吳大學,台北
  • 2014-05-10,如何成为一个数据科学家,华章数据科学工作坊,机械工业出版社,北京
  • 2014-03-29,统计人如何看待数据科学,数盟统计分析聚会,中国人民大学,北京
  • 2014-03-24,大数据时代下传统行业里的数据科学家,光华管理学院狗熊会报告,北京大学,北京
  • 2014-03-08,大数据在欧美的行业应用漫谈,数盟大数据行业应用交流分享会,锦江国际大酒店,武汉
  • 2014-01-12,舆情分析的实现,软件学院业界专家专题讲座,浙江大学,宁波
  • 2013-05-09,基于 R 语言的大数据分析与建模平台,百视通大数据专家研讨会,BesTV 百视通公司,上海
  • 2013-02-27,大数据漫谈,科学学研究所专家研讨会,沪杏科技图书馆,上海
  • 2013-01-19,大数据时代下数据科学的行业应用案例,上海交通大学数据科学与信息产业研讨会,上海交通大学,上海
  • 2012-12-15,大数据与数据分析的行业应用,TMT 青年沙龙 28 期:大数据时代下细分行业热门数据分析及应用,联合创业办公社,上海
  • 2012-12-03,数据及统计中的陷阱,科学松鼠会 ● 科学传播训练营第 14 期:数据之陷阱与可视化,浙江省科技馆,杭州
  • 2012-05-23,新闻中的统计图形,科学松鼠会 ● 第 8 期科学报道工作坊:别让数字吓到你 2.0,徐汇区社会公益组织孵化园,上海

R语言相关

  • 2015-10-24,R 与社会网络分析,第八届中国R 语言会议(南昌会场)暨江西财经大学第一届金融大数据论坛,江西财经大学,南昌
  • 2015-06-07,R 语言中的最优化方法,第八届中国R 语言会议(北京会场),北京大学,北京
  • 2015-05-24,数据科学在业界的应用,2015中国R语言(广州会场)会议暨华南地区数据科学会议,中山大学,广州
  • 2015-04-18,R 与机器学习,2015 数据与价值欧亚论坛暨 R 会议西安分论坛,西安欧亚学院,西安
  • 2014-12-20,地理信息與 LBS 位置服務,R Taiwan 2014 研討會,中華電信學院板橋院本部,新北
  • 2014-12-19,R 在新藥研發中的應用,R Taiwan 2014 研討會,中華電信學院板橋院本部,新北
  • 2014-12-07,地理信息与基于位置的服务,第七届中国R语言会议(上海会场),华东师范大学,上海
  • 2014-11-29,R 与工程开发的实践,第七届中国 R 语言会议(杭州会场),杭州师范大学,杭州
  • 2014-11-15,数据科学中的R语言,第七届中国 R 语言会议(广州会场),中山大学,广州
  • 2014-05-25,R 与 Office 的整合,第七届中国 R 语言会议(北京会场),中国人民大学,北京
  • 2013-12-06,中文文字資料探勘,R Taiwan 2013 研討會,德明財經科技大學,台北
  • 2013-11-03,中文文本挖掘和 tmcn 包,第六届中国 R 语言会议(上海会场),华东师范大学,上海
  • 2013-05-18,禽流感分析中的 R:MSToolkit、Rweibo、html5vis 的介绍,第六届中国 R 语言会议(北京会场),中国人民大学,北京
  • 2012-05-26,基于R和pentaho的全套开源BI平台的实现,第五届中国 R 语言会议(北京会场),中国人民大学,北京
  • 2011-05-28,R 与高性能运算,第四届中国 R 语言会议(北京会场),中国人民大学,北京
  • 2010-11-13,R 语言应用讲座,第三届中国 R 语言会议(上海会场),上海财经大学,上海
  • 2010-06-15,R 与文本挖掘,第三届中国 R 语言会议(北京会场),中国人民大学,北京
  • 2009-12-13,R 在应用领域的扩展:JAVA 开发和最优化,第二届中国 R 语言会议(上海会场),华东师范大学,上海
  • 2008-12-14,利用 R (D) COM Server 实现 R 与 MS Office 的整合,第一届中国 R 语言会议,中国人民大学,北京
  • 2008-12-13,R 在 BI 中的应用和前景,第一届中国 R 语言会议,中国人民大学,北京

开源项目

  • Rweibo,一个新浪微博的 R 语言 SDK,作为 library 在 R 环境中调用, 实现了新浪微博提供的接口,可以进行微博信息获取、用户信息获取、 搜索、发表微博等操作。
  • Rwordseg,一个 R 环境下的中文分词工具,使用 rJava 调用 Java 分词工具 Ansj。
  • tmcn,一个进行中文文本挖掘的R包。包含了中文编码处理、文字操作、 文本挖掘模型和算法的一些函数。主要针对目前可用的R资源的不足而开发的。该工程下还提供了tmcn.crfpp(实现了条件随机场)和tmcn.word2vec (实现了Google的word2vec)这两个子包。
  • Rofficetool,一个R环境下 Office 自动化报告的工具包,通过在 PPT 模板的基础上进行修改的方式生成复杂报告。
  • RbaiduLBS,百度地图 API 服务接口的 R 语言接口。注册百度开发者账号后可以使用该 R 包进行服务接口中提到的相关操作。