msgbartop
ChemHack.com中文版
msgbarbottom

23 三 10 号外号外,Google半只脚迈出中国了

根据路过社最新发来的报道,Google已经半只脚迈出的国内。Google.cn与g.cn已经转移到google.com.hk,即Google香港。谷歌地图(ditu.google.cn)等本地化服务仍没有变化。路人甲继续监视中。

Tags: , ,

20 三 10 买了个g1,又买了个hero

在ebay上看到有不少g1在卖,凑热闹去拍了个二手的。我出价128个英国棒子,结果竟然有人在最后15秒出了136。嘿嘿,我不跟你抢。再拍,128拍到了个全新的。嘿嘿,赚到了。

可是这个卖家是个反应迟钝的主,付款了都三天了才发货。等啊等啊又看到gumtree上有卖g3的,orange的免费upgrade,不想要了想折现。200英国棒子,见面交易。看这价不错,就去面交收来了。贼让人满意的手机。。。

今天g1终于送到了,到了之后我就郁闷了,g1的键盘实在好用。配合谷歌拼音基本无敌了。于是开始纠结g1和g3了。一个打字快,一个系统快。虽然我不是啥重度键盘用户,但是在g3上打上面这么些字可费劲了。恩。这么多字都是g3打的。要是g1估计一半功夫就打完了。

据说g1的系统没法再升级了,自己用下来,开机之后内存只有可怜的40m,程序开多了就会卡。传说中自动对焦的摄像头简直就是山寨机水平。

g3啥都好,但是就是没键盘,我纠结了。貌似我是需要键盘的话痨?貌似现在的机器键盘利用率挺低的。

真折腾。不折腾不舒服斯基。。。。

Tags: , ,

29 一 10 火车余票查询API

火车票最近铁道部干了件好事,有了一个在线余票查询的网站。这是件好事,不过网站也继承了党办网站的光荣传统,Internet Explorer only。这AJAX不光是IE only,还是IFRAME实现,真是个神奇的网站。

不扯了,极光照耀下IE不敢久用,于是做了个API,暂定0.1版,爱哪用那用。

下面来个Example

比如我要查询2月2号北京到上海的车票,那么API调用就是
http://chemhack.com/train/0.1/json/?date=2010-01-29&from=北京&to=上海
或者你也可以指定车次,比如D301好了(这车7xx的票价真是狗血)
http://chemhack.com/train/0.1/json/?date=2010-02-03&from=北京&to=上海&no=D301

然后就返回了格式类似这样的玩意

[
{"车次":"K187","始发站":"沈阳北","终到站":"上海","上车站":"枣庄","下车站":"上海","发时":"06:47","到时":"16:53","历时":"10:06","硬座":"0","硬卧":"1","软卧":"0","无座":"有"},
{"车次":"D29","始发站":"北京南","终到站":"上海","上车站":"枣庄","下车站":"上海","发时":"13:14","到时":"18:44","历时":"05:30","动车组一等座":"0","动车组二等座":"12","无座":"有"},
{"车次":"T177","始发站":"济南","终到站":"杭州","上车站":"枣庄","下车站":"上海南","发时":"20:54","到时":"04:26","历时":"07:32","硬座":"0","硬卧":"14","软卧":"3","无座":"有"}
]

JSON 你懂的
Simple, Easy, Naive

返回结果用了中文JSON;用英文,大家都费劲;用拼音,你不懂,我也不懂。

改日做一个手机WAP客户端,买火车票之前先排队看看。

P.S. 铁道部网站的数据是一个小时一更新。

Tags: ,

17 十二 09 统计数字是不是拍脑袋出来的?87.53%

以下来自Solidot:
“87.53”这一数字近来走红网络:调查100个人,为什么会出现87.53%结果呢?这没什么奇怪,因为统计是编的,而编者可能数学没学好,他/她信守写了一个完全不合逻辑的数据,结果贻笑大方。如果真的是随机调查,那么:第一结果肯定应符合实际,第二它也会呈现出某种统计规律,比如本福特定律(0到9的使用概率呈从高到低分布,排在前面的使用频率最高,排在后面的使用频率越低)。今年6月举行的伊朗大选,美国的研究人员分析了各个选区候选人所得票数的个位数字,结果发现与本福特定律不符,于是断言大选舞弊的可能性超过九成五。
如果统计是编出来的(或者不是编出来的),结果也会呈现出规律,因为数字是有限的,比如统计常用xx.xx%的格式,共包含10000个数字,当样本量够大(超过10000)时,编出来的结果肯定会出现重复,这是抽屉原理所决定的。抽屉原理的简单表述是“若有n个笼子和n+1只鸽子,所有的鸽子都被关在鸽笼里,那么至少有一个笼子有至少2只鸽子”。87.53%并不神奇,鉴于gov.cn各网站已经积攒了足够多的统计数字,你可以搜索类似的数字(使用Google site:Gov.cn),比如17.53%(10,400个结果)、27.53%(55,700)、37.53%(7,030)、47.53%、57.53%、57.53%、67.53%、77.53%、87.53%(4,750)、97.53%;或者你也可以随手写一个如12.34%。如果有人足够闲,可以写个小程序,遍历全部xx.xx%在gov.cn的分布情况,看看是不是真的有特别被偏爱的数字,至少87.53%并不够神奇。

---------------以下为本人瞎写----------------

我不够闲,但是本着严肃的八卦精神,还是写了个小程序把数据爬了一下。为了体现数据的严肃性,爬了xx.yy%(0.01%~99.99%)在以下几个网站中返回的结果个数。(使用site:xxx.com作为搜索参数进行限定)

sites=c(“all”,”gov.cn”,”stats.gov.cn”,”163.com”,”sohu.com”,”xinhuanet.com”,”wikipedia.org”)

“gov.cn”,”stats.gov.cn”,”163.com”,”sohu.com”,”xinhuanet.com”,”wikipedia.org”

作为对照,又爬了Google收录的所有网站中返回的结果数。获取的全部数据我放置在了 http://chemhack.com/data/googleNums/ (逗号分割文本格式)。

注:Google本身并不搜索百分号(%),不管你搜索5.04还是5.04%,获得的结果都是一样的。

写了个R脚本,画张图,给个整体印象。x轴就是统计数字(xx.yy%),y轴是他们出现的次数。

All Img

情理之中,意料之外,统计局(stats.gov.cn)的图形是最漂亮的。不过其中奥秘之处还有待高人分解。

01 十一 09 帖图两张 无评论

49cde67ah5de4cf771dc7

49cde67ah5de4d255c3d7

18 十 09 德国签证流水账

又是好久没更新了,得上来冒个泡。话说去年冬天无意中做了jsMolEditor,到现在还是preview状态。暑假的时候看到了German Conference on Chemoinformatics在征集Poster,就写了个Abstract,请Rich帮忙用他纯正的native scientific English润色了一下,投了出去。开学没多久,GDCh告诉俺这Poster收了。收了那就去开会吧,去见见大牛教授们。轻轻的俺来了,就带了一个poster,轻轻的俺走了,送俺一个offer吧。

下面开始签证流水账,首先你需要一个护照。现在护照已经实行按需申办了,就是想办就办了,出国理由就填“旅游”好了,这个是万能理由(换外汇也是如此)。现在上海办护照可以在邮局通过EMS快递申请表,方便了不少,不用自己去跑路排队了。办护照用的户口本对于在校学生的集体户口来说自然是没有的,这时候就需要开个户籍证明了。连同3张照片,一张申请表,外加身份证、户籍证明复印件一同交给邮局窗口,邮局会帮你快递出去,过几天你就能收到一封回执,上面写有你的领证日期。一般大概是10个工作日,办好之后取来就行了,交费200块。有效期一般为10年,如果没啥需要提前申领好了也没啥坏处,反正10年才过期。

护照OK了之后,就是签证。预约签证直接给他们发邮件吧,那个电话永远打不通。德国的短期申根签证大概也就是旅游探亲和商务这两种。去开会算是商务签证,按照德国领事馆网站关于商务签证的说明准备申请材料即可。必不可少的材料如下:申根签证申请表、对方的邀请函(尽量是亲笔签名的原件,万不得已用PDF打印件也可以)、自己学校的介绍信、保险单复印件、资金证明(在邀请函或者介绍信里说明费用由谁承担)。以上所有的材料都需要是英文或德文或中英或中德文对照。

介绍信这样格式即可 XXX(护照号码:xxxx)是我校xxx学院xxx专业学生,本校准予XXX于xxx期间到xxx参加xxx会议并xxx。XXX将在会议之后返回学校并继续完成学业XXX。保险随便买哪家,保额在30000欧以上即可,有英文或者中英对照保单即可。保单最好提早打算,我到快签证的时候才想起买保险,结果国庆期间,保险公司都不上班。幸亏法国人不上班,在线买了,然后彩打出来,一样OK。办签证的时候可以选择把护照EMS回来。这样签证做好之后会直接EMS给你,不用自己上门排队了。上海市内35块,还是可以接受。顺利的话5个工作日就可以拿到签证。

以上为流水账,希望碰巧有谁Google进来能有所帮助。

Tags: , ,

12 九 09 2009.9.11深夜暴走 华东理工->外白渡桥

2009年9月11日 为纪念9.11事变8周年 mlkz深夜党一行6+1(半路加入)人开始了 华东理工->外白渡桥的17km的深夜暴走

9月11日 夜 10:30 于华东理工大学梅陇校区大草坪毛主席像后拍摄

出发地 主席像

东门口的行知路

行知路

老沪闵路

老沪闵路

沪闵路地道

沪闵路地道

高架下

高架下

某医院

IMG_2024

漕溪路立交

IMG_2046

徐家汇公园的滑梯

IMG_2067

偷拍中的李翔同学

IMG_2061

这是只猫。。。

IMG_2070

衡山路上一个阴森的院子 拍电影的?

IMG_2076

半路休息,星星(见下图)请客夜宵(可乐)-.-!

IMG_2097

传说中的龙柱,天机不可泄露。

IMG_2108

路上的广告,右边还有“彩”字。。。

IMG_2100

然后抵达南京东路,大概是凌晨2点多,诺大的南京路步行街上就没啥人。。。

IMG_2117

快走道外滩了,结果看到这么一个玩意

IMG_2119

那就不去外滩了,直接去外白渡桥

外白渡桥

IMG_2125

绕到了俄罗斯领事馆之后,大家基本已经都不行了,分两辆车打车回人民广场,斗地主。。。

我连续当了2×2次地主,赢了2^2次。。。

空空的八号线站台

IMG_2131

回学校,天亮,睡觉,夜暴结束。。。

Tags: ,

11 九 09 Beijing Open Party

Beijing Open Party结束了两周了,个位同学blog了那么多东西,俺啥也没share,甚是惭愧。刚看到Open Party的网站的总结贴,干脆就暴张照片上来吧。

至于有夸到俺的贴子,俺就低调的给个链接 1 2

Tags: ,

21 八 09 化学信息学101(1)

注:本文由段炼翻译自eMolecules,英文原文版权由eMolcules所有,转载请注明。

原文地址:http://www.emolecules.com/doc/cheminformatics-101.php

化学信息学101

关于化学信息系统的计算机科学与化学介绍

Craig A. James, eMolecules公司

目录

1.化学信息学基础
2.分子表示
3.子结构检索与索引
4.分子相似性
**化学品登记系统


第1章.化学信息学基础

什么是化学信息学?

化学信息学是计算机科学与化学的一个交叉学科:主要和化合物有关信息的储存与检索打交道。

信息系统所涉及的是存储、检索和搜索信息和信息之间的关系。例如:

操作 传统信息系统 化学信息系统
存储 Name= ‘Jimmy Carter’ 储存文本、数字、日期 … 储存化合物和有关信息。
检索 查找记录#13282 检索’Jimmy Carter’ 查找:
CC(=O)C4CC3C2CC(C)C1=C(C)
C(=O)CC(O)C1C2CCC3(C)C4
检索:
搜索 查找名为’Bush’的总统 George Bush 和 George W. Bush 查找包含以下结构的分子:
返回:
关系 Carter当选的年份 答案:1976年当选 该分子的logP(o/w):
logP(o/w) = 2.62

化学信息学什么不同?

化学信息系统主要解决四个关键问题:

1、保存分子 计算机科学家通常使用的化学价键模型表示化合物。Section 2, 分子表示 ,将会信息讨论这个问题。
2.找到确切的分子 如果你问, “Abraham Lincoln在不在数据库中?”这不难找到答案。但是,给出某一个的分子,它在不在数据库中?关于它我们都又什么数据?乍看之下这似乎简单,但是当我们讨论到互变异构体、立体化学、金属,和其他“瑕疵”的化学价键模型时,就不是那么简单了。
3.子结构检索 如果你问, “数据库中有没有叫Lincoln的人? ”你通常期望找到Lincoln总统和其他一些人-这就是所谓的搜索 ,而不是查找 。对于化学信息系统,我们有子结构搜索 :查找所有含有用户所画出的部分分子结构(以下简称“子结构” )的分子。子结构通常是一个官能团, 脚手架 ,或代表了一类分子的核心结构。由于一些很底层的数学与可计算性理论的原因,这也是一个很难的问题,要比大多数文本搜索 难的多
4.相似性搜索 一些数据库可以找到发音相似或拼写错误的字词,如“查找Lincon”或“找到Cincinati” ,它们分别可以找到Abraham Lincoln和Cincinnati。许多化学信息系统可以找到与指定的分子相似的分子,并按照相似性排名。衡量分子相似性又好几种方法,Section 4,分子相似性 中会进行深入讨论。

注:本文由段炼翻译自eMolecules,英文原文版权由eMolcules所有,转载请注明。

Tags: ,

03 六 09 河蟹大爆发

经过最后确认,Twitter、Bing、Live、Hotmail、Flickr等一干网站已经被河蟹。昨天是六月二号,今天是六月三号,明天是××××。在这个时候,只能以这个理由来猜测河蟹大墙被启动的原因。让墙来的更猛烈些吧。

附小诗一首,来源不详。。。。

小时候
互联网是一枚小小的船票
我在这头
Youtube在那头
长大后
互联网是一张窄窄的船票
我在这头
Twitter在那头
后来啊
互联网是一方矮矮的坟墓
我在坟里头
flickr在坟外头
而现在
互联网是一湾浅浅的海峡
我在这头
大陆在那头