msgbartop
Hacking the chemistry world.
msgbarbottom

13 Dec 08 Render Molfile in Browser Without JRE or Any Other Plugin!

I’m very excited to tell you MX-GWT’s prototype for molecule image rendering is available now. We’ve many many programes can render MOL or SDF files into image already, why I’m working on another one? The key difference is, this one can work in all major web browsers without plugins needed. NO Applet, NO Flash, NO SilverLight! 

Though it’s a very early stage prototype, I think you can see future molecule editor could be loaded into browsers without plugins.

Here is the demo page.

12 Dec 08 五毛党扬名欧洲-囧评论[08-12-12]

五毛党出名到瑞士了

匿名人士评论瑞士媒体称中国网民为赚5分钱欧元骂法国时如是说

07 Dec 08 张五常:最蠢的还是马克思

  几个月前读到关愚谦先生在《信报》发表的《和德日学者讨论“共产”一词的出处》,觉得很有意思,所以要在这里回应一下。关先生提出的要点,大致如下:
  (一)Communism中译为“共产”,是日本仔发明的,中国在老毛带领下,把日译的“共产”搬进中国。   
  (二)日译“共产”的原意,是“共同集体生产”──是生产的“产”,非财产之“产”也。
     (三)“共产”一词到了中国,顾名思义,就变成财产的“产”,此乃大错,而后来老毛实行共财产而走向“大锅饭”的人民公社,一错再错,呜呼哀哉!
   
  我认为把“共产”解作“共同集体生产”,是对的,因为Commune(公社)一词,的确有“共同生产”之意。然而,从今天经济学的角度看,日本仔相当蠢。这可不是因为他们错,而是对得太厉害!试想,在香港、美国等“资本主义”的地方,差不多所有生产都是“共同集体生产”的。
   
  可不是吗?在我们所知的所有机构,不管是上市或是独资的,皆共同生产也。就是我现在独坐桌前爬格子,也是与报刊的多位仁兄共同生产的。既然差不多无“产” 不“共”,而Communist肯定不是指我这个写稿佬,把Communism译作共同生产不仅毫无新意,而把我这个奉信“私产”(财产的“产”)的人说为“共产”成员,实在有诽谤之嫌!从日本仔的角度看,我是个以私产来共“产”的人,非老马所说之Communist也。
   
  从今天经济学的角度看,老毛把“共产”解作“共他人之产”,与老马的心意是较为接近的。老毛未老时,熟读老马的《资本论》。该“论”的确有“共他人之产”的倾向。
   
  在大学念书时,我也曾拜读老马的《资本论》。但当时我比老毛幸运,因为我对费沙的“资本”概念与高斯的定律皆懂得通透。因此,我老早就知道老马胡说八道。
   
  在《资本论》中,老马不反对市场。正相反,他认为市场大有好处。老马也不反对私产,虽然他没有高举私产的功能。老马反对的,是资本家──以“剩余价值”来剥削劳力的资本家。在费沙与高斯的思维下,老马这三个论点怎样也加不起来!
   
  费沙与高斯皆逻辑井然。以费沙之见,所有生产资料都是资产,而资产私有,其市值就是资本。以高斯之见,没有私产就不可能有市场。那么老马赞成其一(市场),不反对其二(私产),反对其三(资本家),岂不是难以自圆其说?
   
  我认为老毛把“共产”解作“共他人之产”,比日本仔高明,是因为老毛显然是从老马反对资本家的立场作为出发点。不硬性推行吃大锅饭的人民公社,怎可以废除费沙所说的资本家?
   
  一九六八年,我在芝加哥大学写了一篇搞笑的短文,不打算发表的,题为《费沙与红卫兵》。内容是说小小的红卫兵深明费沙的一般性的资本概念,比老马高明,他们的行动是要彻底地废除费沙笔下的资本家。这篇短文在芝大经济系内传阅时,该校大名鼎鼎的《政治经济学报》的老编读到,拍案叫绝,坚持要把该文发表。
   
  老毛在中国搞的人民公社,当然是一种“共同生产”的制度。但那所谓“公社”与资本主义下的“共同生产”机构有一点重要的不同,那就是前者一定要吃大锅饭。这是因为“公社”的成员若能自由转业,可以随时另谋高就,资本家就必定会出现。若不容许自由转业──不管是搞什么“公社公分制”或“多劳多吃制”──大锅饭在所必然。既然大家吃大锅饭,私产就没有什么意思,要把之废除易过借火矣!
   
  共同生产或多人把财产合并而成公司,只要有清楚的权利划分,或以股份界定权利,有自由的转让及转业权,就是私产制,每位参与者都是个资本家。这与老马笔下的Communism是大有出入的。Commune(公社)不是合作或共同生产那么简单。“公社”的重点不是共同生产,而是强制参与,其权益夸夸其谈,但因为没有股份转让权及自由转业权,参与者就变为肉在砧板上。逼而成的大锅饭是“共他人之产”的制度,彻底行事,就没有资本家,这应该是比较适合老马的心意的。
   
  愚见以为,日本仔把“共产”解作“共同集体生产”,不可能错,但因为凡是社会皆如此,说了等于没说,是相当蠢的。老毛把“共产”解作“共他人之产”,可能错,但从以强逼“共同生产”的办法来铲除资本家的角度看,其对老马的解释则比较高明。很不幸,此“高明”却把国家弄得民不聊生。
   
  困难还是马克思自己。他是个术语的创造者,有理无理总是说不清,是自欺还是欺人,又或是自欺欺人,恐怕他自己也搞不清楚。他瓜豆了百多年,今天的日本仔、德国佬及我们的关愚谦先生,还是要研讨他究竟是说什么!
   
  天下间怎会有那样高深的学问?所以我认为马克思是最蠢的。

04 Dec 08 VMWare Server,很好,很牛,很强

没的说了,这东西都免费,没天理了

Web Client做的很赞,系统效能也不错,Port Mapping很贴心,目前运行状态良好

03 Dec 08 NUDDB Development Diary #2 2008-12-3

Newly Done:

  1. Display of bigger image in ajax-style popup window(jQuery implement).
  2. Display of protein image(Jmol implement, maybe source-layer port is needed).
  3. Descriptor calculation.

09 Nov 08 互联网免费存在论——别让免费遮住了你的眼睛


当你正享受着互联网免费午餐的同时,肯定会有另一个倒霉鬼为你买单,以填补价值空缺。只有这样价值链才是完整的。

新媒体尤其是互联网产品及服务的免费之路一直是业界探讨的焦点,很多企业因为自己产品或服务的免费获得了成功(Google是最好的例子),很多企业也因为自己兜售的的免费商品而苟延残喘(很多因为缺乏资金周转濒临破产或进入冬眠状态的企业俯首即是)。很多用户对互联网应用的免费一直存在偏见:他们要么过度推崇在SAAS时代一切服务应该免费,要么过度担忧免费所带来的用户体验的变质,另一群人却在免费与收费之前艰难的游走。

我希望通过四个方向来思考免费存在的问题:免费的种类,免费如何存在,免费是进步还是倒退,免费如何指导互联网企业发展。而第二个问题是我想重点讨论的,尽管如此我还是只能对这些问题进行泛泛而谈。

免费的种类

《连线》总编,《长尾理论》作者克里斯·安德森(Chris Anderson)在《免费:商业的未来》一文中提到“企业的主要成本正体现为高技术设备;然而,免费并非是一种选择,而是一种必然宿命。”(The moment a company’s primary expenses become things based in silicon, free becomes not just an option but the inevitable destination.)而他在文中也概括性的提到了免费的种类:免费增值模式,广告模式,交叉补贴模式,零边际成本模式,劳务交换模式,赠予经济模式。

  1. 免费增值模式(Freemium),Flickr是这种模式的代表,网站在1%法则的指导下对那99%的用户实行免费,只对那1%用户收取增值服务费。而这1%在100%下再加上网站用户群的宠大,整体来说网站还是免费的。(国内最大的图片托管商Yupoo也这个月也引入了这种模式。)
  2. 广告模式(Advertising),百度,新浪是这一模式的代表,你在使用搜索引擎和门户的同时也点击了其页面上的广告,在免费的同时你也创造了价值。
  3. 交叉补贴模式(Cross-subsidies),这种形式目前我还没找到一个比较专门化应用的网站,但绝对是大多网站包括传统企业经常应用的模式,用一个例子来说:网站送你一台游戏机,这是免费的,但一台空壳游戏机对你几乎是毫无用处的,除非你购买它的游戏光盘。
  4. 零边际成本模式(Zero marginal cost),在线数字音乐是一个典型,在线音乐发行的成本随着规模的扩大渐趋为零。
  5. 劳务交换模式(Labor exchange),这一点在国内一些下载站和垃圾站点很常见,当你在浏览或者下载时网站后台程序强制性地把你带到广告页面,不但消耗你的带宽而且你需要耐心地去应付不断弹出的你不希望看到的页面。
  6. 赠予经济模式(Gift economy),开源软件及其应用下的服务占却了这种模式的半壁江山。一切都是免费的,而且不需要你直接甚至间接的付出任何价值。

免费如何存在?

通过以上对免费的归类我们不难找到一个共同点,正如文章题记所述:当你正享受着互联网免费午餐的同时,肯定会有另一个倒霉鬼为你买单,以填补价值空缺。

是的,免费的本质正在于此,资本市场不可能让一部分价值白白流失到你手上,它需要通过各种途径去寻找补偿来填补这种价值流失,而这个为你的免费买单的人要么是你自己,要么是别人,仅此而已。在一定程序上这些为你买单的人得到了他希望获取的价值,但事实上他们的付出要大于他们的实际收入,因为其中还包括为你买单的的那一部分。

我们再回到上面的免费分类上来,

  1. 免费增值模式下你是免费的,一些VIP用户通过每年XX $的费用为你的免费空隙进行了补充。你需要付出几乎为零(如Picasa Web)或者需要在图片外链显示上看到广告(如Yupoo.com),或者直接在访问网站时无法回避广告(如Last.fm)。
  2. 广告模式下来进行免费价值补空正是你自己,在你使用Google时点击结果右侧的关键词相关广告时,在浏览搜狐网点击或者观看闪烁的Flash Banner时你就已经创造了价值,并对你所得到的“免费”服务和内容进行补偿。
  3. 交叉补贴模式下当你得到一个被赠送的商品或者服务时,你不得不花钱购买相对应试的商品或者服务才能达到你获取此种免费物的目的;当你尝试一些免费的试用软件或者服务后,如果用户体验很好并打算继续用下去的话你需要花钱来购买正式授权版;或许当你注册了一个iTunes帐号,并可以用它免费下载一定量的音乐后,如果还要继续下载你需要用Paypal为你的iTunes购买行为买单。凡此总总,当你获得免费的同时,都是你自己在为你之前的午餐付账,来平衡市场的价值转移。
  4. 也许零边际成本模式是你比较喜欢的一种免费形式,因为本质上你不需要为此付出任何价值(一些网站的强制广告除外)。但当你在Myspace或者某个乐队个人网站上免费下载了专辑后,如果觉得不错你会向朋友宣传,从Amazon或者卓越亚马逊网购买他们的唱片,甚至买他们演唱会的门票,这一切都是你创造的价值。
  5. 劳务交换模式是让很多人深恶痛疾的事情,就像病毒,你要得到这个网站的东西你就不得不花大量时间的精力来面对木马、广告、强制下载、甚至病毒。我可以告诉你,当你在获取这种免费时,你在用一种最原始的方式来偿还,去应付诸如只能用快车或者Web迅雷才能下载的资源,去点击Google Adsense下的带Google工具条的Firefox或者Picasa照片管理软件。
  6. 赠予经济模式已经开始被越来越多的人接受,开源已经成了很多人脱口而出的词汇。我们免费在软件的官方网站上下载源码并在一定协议下自由修改,自由传播;我们甚至免费从维基百科上获取海量的知识或者自由地修改他人编辑的词条;我们随时可以从Wordpress上下载一个Zip压缩包,修改后安装在自己的服务器上,在不在网页底部添加Powered By也是你的自由。似乎这已经很完美了,正是人们希望的那种免费模式,但是却有一群基金会、赞助商等在为你买单,如果你反过购买这些赞助商的产品时,你又成了这条价值链的被动者,一切都是相互联系的。

也许到了这里,你听了我一大堆解释已经很清楚了免费的本质,也明白了免费存在的形式。是的,一个人获取了免费,总有人来为你的这种免费进行补偿,最后实现市场价值链条的平衡。何不让我们进入下一个问题。

免费是进步还是倒退?

很多人一直坚持互联网产业的商业化运作才是互联网成功的标志,一切都是有偿的,天下哪有免费的午餐,只有付出才会有收获。即使有偿获取,我们会发现同样的服务和产品我们需要花的钱越来越少了,一个硬盘,一个服务器……

是的,在目前的市场体系下,经济环境里价值产业链必须是平衡的,如果哪里出现了中断,丢失了的没有及时补充回来,那市场的链条就很难维持下去了,生锈就成了必然了。但是我们这里所列举的互联网上已存在的免费形式(有些已经取得很大突破和成熟)却正是遵循了这一原则。“免费”只是一个称呼而已,我们获的东西并非无偿的,只是有其他有共同利益追求的人而为此进行偿还。

我们免费获取,他人来补充。整个链条还是完整的,并没有出现中段。相反“免费”才是互联网运作的一个升级,才是互联网产业化的成熟阶段。可以说免费模式让互联网的产业链条更紧密,更牢固了,相互之间的价值关系也更密切了。

免费如何指导互联网企业发展?

正如文章开头所说的很多提供免费服务的互联网公司缺乏一个良性的盈利模式,欠缺足够运转资金而不得不关门大吉,那么互联网公司应该如何优化这种免费模式呢,如何在这种免费中寻找企业自身的定位呢?

我觉得我们互联网公司应该明白一个关系,就是用户免费获取价值,而企业应该尽最大努力寻求补偿,以使价值链保持健康和完整。

不管你选择哪种模式,你需要定位一个单位来为免费的东西付账。根据企业的自身情况,这个单位可以是用户自己,VIP会员,广告商,赞助商……再确定补偿的形式,是货币直接补偿,劳务补偿,还是其它变向补偿?但有一点是很明确的,投资人绝对不属于这个单位的范畴,因为很多公司过度依赖风投和天投,结果导致悲剧。投资人并非来为这种免费买单,而是到这里来“无偿”获取价值的。

最后我想说的是:免费一直存在着,只是别让它遮住了你的眼睛。

30 Oct 08 what you truly want to become

Your time is limited, so don’t waste it living someone else’s life. Don’t be trapped by dogma — which is living with the results of other people’s thinking. Don’t let the noise of others’ opinions drown out your own inner voice. And most important, have the courage to follow your heart and intuition. They somehow already know what you truly want to become. Everything else is secondary.

27 Oct 08 哈佛评论:要善于发现客户潜在需求,前期必须引导培养客户需求

一男赶集卖猪,天黑遇雨,20头猪未卖,到一农家借宿。 
少妇:家里只一人不便。男:求你了,给猪一头。少妇允。男将猪赶 入圈,与少妇家十头猪关在一起。 
少妇:家里只有一床。男:我也到床上睡,再给猪一头。女同意。 
半夜男商女:我到你上面睡,女不肯。男:给猪两头。女允。 
少顷,男忍不住,央求动一下,女不肯。男:动一下给猪两头。女同意。 
男动了八次停下,女:为何不动?男:猪没了。女小声央求:动动吧,要不我给你猪…… 
天亮后,男吹着口哨赶着30头猪去了集市… 
哈佛评论:要善于发现客户潜在需求,前期必须引导培养客户需求

26 Oct 08 ChemSoSo的新变化

首页的导航图标有点眼熟?有点Google过头了。。。。

这个是MSDS?没错,就是它。常见的物质都有,不用到处找数据了。

05 Oct 08 旧文重发之结构检索

对于大型分子数据库来说,结构搜索一直是个难题。动辄上千万条的分子数据,对检索速度的要求必然很高。这里我将结构搜索分成三种:第一种是结构精确匹配,第二种是子结构匹配,第三种是相似结构匹配。

对于精确匹配,没有任何难的地方,查找到完全一致的SMILES表示即可(虽然也有SMILES表示不唯一等小问题,但这都是小问题)。难的地方就在子结构检索和相似结构检索上。十几年间的化学信息学系统一直在尝试解决这个问题,由此也提出了很多的方法,有基于键的,基于原子的,当然还有基于碎片的分子指纹。

分子指纹是对分子结构特征的一种非常抽象的表示,在我们开始讨论分子指纹之前,先从化学信息系统的远古时代开始,了解子结构检索和相似结构检索是如何进行的。

很多子结构检索算法都需要对大量的分子进行重复比对,一般来说,都是直接将分子结构以某种编码形式保存在数据库中,但是这样的效率是很低的,当数据库中的数据量逐渐增加时,这种方式会带来相当难解决的性能瓶颈。后来就有人提出,可否对数据库中的结构数据进行预处理,以提高搜索进行的速度。尽管预先处理也是需要消耗性能的,但是预先处理只需要进行一次,会给检索性能的提升带来巨大的回报。

举例来说,我们要检索所有包含乙苯结构的分子,首先可以确定它的分子式C8H10,这样,类似C2H6的小分子就可以完全排除掉了,我们只需要检索比C8H10大的分子即可。由此可以看出一点,排除掉某种分子的成本确实要比确定某种分子是其子结构所要的成本低的多。也就是说,如果可以避免进行“正选 ”,而尽量多地运用“排除”手段,系统的检索效率则会高很多。除了分子式之外,相对分子质量、不饱和度等各种描述符(descritor)也都可以用作判断依据。由此以来,搜索范围可以大大缩小。

这样,搜索范围被缩小了,但是还没有涉及到实质问题。

有个叫做“结构密钥”(Structural key)的概念首先被提出了。结构密钥通常用二进制串表示,二进制串中的每一位只能是0或者1。如果某个位是1,就说明这个位所代表的结构特征存在,如果是0,就表示这个位所代表的结构特征不存在。这样,在比对两个分子结构时,只需要比对其结构密钥即可。不过,要确定一个结构密钥,首先就需要定义结构特征以及结构特征所对应的二进制位。一般来说,这种定义是可以任意进行的,定义的方式也有很多种。举例来说,是否有N原子、是否有环状结构、是否有羟基、是否 有羰基这些都可以作为定义结构密钥的依据。确定了结构密钥的定义之后,就可以按照定义为数据库中的所有分子生成其结构密钥了。尽管为数据库中的所有分子生 成结构密钥的过程可能很长,但是这样做的效果是很显著的。

在结构密钥之后,分子结构检索随着分子指纹的出现又发生了一次大的变革。分子指纹是比结构密钥更抽象的一个概念,上面我们所说的结构密钥缺少通用性。对于结构密钥的定义会很大程度上影响到检索速度。一个良好的定义可以显著提高搜索速度,反之低质量的定义会大大降低检索的命中率。结构密钥的定义也依赖于查询的用途,研究石化方向的专家所定义的特征可能对研究药物的专家毫无用处。

继续太监。。。。。。

不往下写了。。。。