为什么web会是现在这个样子? 好文| Throwing Tables Out the Window

December 20, 2005
下面是Nature 11月份上一篇新闻报道的翻译,Google的数据库遍布世界各地,Google Base让人们联想到Semantic web,而这两者加起来又让人们联想到“数据网格”,也许Google将是数据网格被普通人使用的开始.

原文标题和地址:Google Makes data free to all

Google在上星期启动了它的一项新服务——Google Base。它允许任何人免费上载文件到Google服务器,使得数据立即可以被检索。虽然这项服务主要定位是在线市场:比如工作和居家,科学家们说这项服务也蕴含了巨大的针对科学数据进行共享的潜力,并且可能使得整个Web变得更加具备“智能”性。

Google Base允许用户上载数据,并允许用户用简单的标签来描述数据,其他人可以在搜索中使用这些标签。它还让用户随时增加字段,以让这些非结构化的数据变为结构化的数据。一个包含一篇科学文章的网页也许会利用“作者”、“期刊”、“出版物”或者其他关于文章的元数据信息的字段。

这也许听起来并不是一项复杂的技术。但是鼓吹者认为它使得Web内容在整体上变为结构化的数据库。它开始使得科学家们共享数据、以便于搜索的形式存储数据变得更简单。

David Haussler(加利福尼亚大学生物科学与工程中心的director)说,在共享数据方面,科学家们仍处在一个“黑暗的时代”。那些存在于基因序列、蛋白质结构、天文数据等几个相对很少的大型世界级数据库之外的数据,最终以附随期刊文章的辅助表格的形式从这个世界上消失。他说,“它们以不可索引、不一致、不方便的形式存储,如果说它们真的被保存的话”。

网格概念的创始人Ian Foster说,Google Base或者类似的服务或许能够发挥它的作用。在“网格”中,很多计算机协同起来提供大量的处理能力和数据存储能力。Ian Foster认为,科学研究急需一些能够使得个人、团体创建和共享数据以及处理这些数据的程序变得更容易的东西。

提供一种简单地能够交互检查多种类、多来源数据的途径能够给科学研究带来真正的实惠,来自明尼苏达州大学生物信息学的Paul Myers说,“我认为Google在这方面是超前的,这个工具的重要性将会变得不可估量”。

Smart Systems(智能系统)

Google Base也许还意味着是Web向智能网络前进的一个低调谨慎的开始。Web向智能网络发展的思想最初是由Web的创始人Tim Berners-Lee于1989年在欧洲高性能粒子物理实验室CERN提出的。

网页的设计只是为了方便人的阅读,并不包含那些计算机能够处理的附加描述信息。这种设计思想限制了它们的用处,尤其是对那些搜索网页的用户来说。例如,现在我们不能够通过Web搜索“关于蛋白质CCR5激活PYK2实验的,并被同行评论的论文”。当我们在线阅读论文时,不能够让计算机重新画一个概念图以包含一些额外的数据集。

Berners-Lee倡导一种被称为“Semantic Web(语义网)”的东西,它将网页加上标签,从而使得计算机能够理解网页的内容。这意味着计算机能够询问那些网页上的数据是否满足一定的条件,以及从不同的数据源进行数据的融合。

但是,虽然语义网在生物信息学等一些专门的领域很快建立了基础,它仍然没有广泛地推行。科学家们认为,Google Base能够改变这种局面,因为它能够将大量结构化的网页聚集起来。“最大的问题在于这样的服务是否能够对引导语义网起到作用”,Greg Tyrelle,台湾Chang Guan大学的一位生物信息科学家说。

Google power

“对包括科学数据在内的任意的数据进行在线的灵活存储,是近两年一个主要的研究领域”,Leigh Dodds,Ingenta出版社的一个Web专家认为。“Google Base将其扩展到每个人,使得这项研究推进了一大步”,虽然他还说希望看到政府、大学也推动类似的服务,而不是只留给Google来作。

但是,科学家指出,Google在W3C 组织关于Semantic Web标准制定工作方面的缺席是突出的。他们还承认,和那些专业的数据库,比如GenBank, UniProt等比起来,现在Google Base服务还是相当粗糙的。你所能做的只是发布信息,搜索信息,它没有提供对这些数据实行抽取、计算的途径。

但很多研究者相信这种情况很快就会改变。Google已经对其他的服务公开了其API接口,同样,对Google Base 服务也不会例外。它将允许任何人写可以访问Google数据库的程序,将Google数据库中的数据同其他数据混合、匹配,以创造出完全不同的新产品。

“如果Google 意图将Google Base变为不再仅仅是一个查询信息的工具,而是供科学家发现数据的东西,更多的工作需要去做。”耶鲁大学生物信息学科学家Mark Gernstein说。

但是根据Foster的观察,这样的进程将会很快发生。“Google 有很多相关技术和专家,如果它组建了合适的团队并投入足够的资源,就一定能产生巨大的影响”。

“Google Base现在看起来还有点简单,而且还不清楚怎样去接入Google power,但是这毕竟已经开始了”,Myers说。
translated by Jacquette

Tags: No Tags

相关文章:

推荐文章

您的评论对我们很重要:

4 Comments »

  1. 自己很少用,但是奇怪怎么就没有想到呢。以前也曾经对一些数据发发牢骚。现在情况确实在改变了。

    Comment by arret530 — December 22, 2005 @ 5:43 pm

  2. Data share, especially the spatial data shere is the key issue of information systems applications, which will save too much money to establish the systems and make the world develop more rapidly.

    Comment by Yang Kun — February 14, 2006 @ 10:41 am

  3. 成为科学家的梦想可以在任何一个互联网终端上实现
    知识信息应该被还原成它原来的样子
    人类共同收集整理,共同拥有的财富
    任何具有科学素养的人都可以方便,免费的利用它们

    Comment by bunny forth — July 30, 2006 @ 3:26 pm

  4. […] Google Base与科学家数据共享 万能数据库,Google Base Google Base会灭了Craigslist吗? Google Base:未来的信息标准 谈谈Google Base 我看到的google base是一个超级wiki […]

    Pingback by 晨钟暮鼓 » Blog Archive » Google Base Store Connector发布 — June 17, 2007 @ 7:52 pm

RSS feed for comments on this post. TrackBack URI

Leave a comment