acm-header
登录

ACM通信

给编辑的信

注释元数据的多种方法


给编辑的信插图

来源:iStockPhoto.com

Anastasia Ailamaki、Verena Kantere和Debabrata Dash(2010年6月)的文章《管理科学数据》解释说,研究项目生成的数据只有在用描述数据来源、上下文和意义的元数据注释时才有价值。然而,给定的数据项可以以多种方式进行注释,原因有二:

出处。多学科项目可以通过基本元数据跟踪其进展,这些元数据表明其样本及其相关数据的来源。还可以通过特定于用于生成数据项的技术的工具以更详细的方式注释每个数据项;这些注释本身可以被相关学科的人员(和软件)解释;而且

假设。根据定义,研究领域包括一组用于理解该领域但尚未达成一致的基本概念。除了记录数据的地点和时间之外的注释包含了专家之间可能存在争议的假设。

因此,数据存储和元数据应该解耦。数据存储库必须能够返回存储在其中的任何数据项,以及查找相关元数据所需的位置列表。元数据存储库必须能够识别它所遵循的模式,并使用相关注释响应关于特定数据项的查询。

以这种方式解耦体系结构可以简化存储库和注释模式的生态系统的开发。

克里斯·莫里斯,英国沃灵顿

回到顶部

作者的回应:

独立(和多个)元数据存储对于许多科学应用程序来说确实是必不可少的,并且应该作为一种选项供用户科学家使用。但是,由于数据查询可能需要组合保存在单独元数据存储中的信息,因此处理它们需要适当的分布、访问控制以及存储的合并和分支机制。

Anastasia Ailamaki, Verena Kantere, Debabrata Dash,瑞士洛桑

回到顶部

实证研究中没有稻草人

他的观点是“计算机科学是真正的科学吗?”(2010年7月),冈萨洛Génova如果他使用“理论的”或“概念的”而不是“推测的”来支持他的论点,反对当今许多CS研究过度的经验主义取向,他会有一个更有力的例子。科学思想的生命周期通常是从探索阶段开始的,在这个阶段,许多候选思想被追求,只有少数幸存下来,作为理论贡献被提出或发表,通常有强大的分析模型支持。期刊编辑不太可能草率地拒绝进入这一阶段的投稿,因为它们提供的猜想和假设可以通过严格的以经验为导向的研究来检验。

Génova还设立了一个稻草人,当他反对过度的验证主义和经验主义。谁会反对可信的科学进步需要良好的实证研究实验、模拟、概念验证原型构建和调查这一命题呢?这样的研究需要模型和假设,这些模型和假设可能在较早的时间点作为投机性的猜想开始。

Naïve经验主义在计算机科学研究中没有立足之地。此外,没有充分分析基础的纯推测性研究不太可能有助于推进计算机科学(或任何其他)研究。

约瑟夫·g·戴维斯,悉尼,澳大利亚

回到顶部

作者的回应:

戴维斯(“可信的科学进步需要良好的实证研究”)和我(“没有投机思维指导的实验毫无价值”)基本上都同意。当我说“思辨思维”时,我指的是“由强有力的分析模型支持的理论贡献”,而不是毫无目的的自由舞蹈。

对于我批评过的过度的经验验证,可能也会有轻微的分歧。很明显,关于物理现象的理论需要经验验证;关于数学对象的理论则不然。计算机科学中的许多领域处理的概念或信息对象更类似于数学对象,而不是物理对象。因此,要求经验验证在这里是不合适的

冈萨洛热那亚,马德里,西班牙

回到顶部

CS学者认为他们教什么

保尔-亨宁·坎普(ppaul - henning Kamp)的文章《你做错了》(2010年7月)如果写得更专业,更重要的是避免明显的夸张,将会更有价值、更有效。例如,Kamp说图7中描述的计算机架构“在今天是完全虚假的”。错了。尽管它很简单,但对于初学者来说,作为第一个体系结构是完全合适的,因为他们中的大多数人甚至无法提供像“输入”和“输出”这样的单词的精确定义。同样,Kamp所说的“这是计算机教育中使用的唯一概念模型”也不可能是正确的。

亚历克斯Simonelis蒙特利尔,

回到顶部

作者的回应:

对这篇文章的反应,计算机科学学者感到生气,抗议所谓的教育缺陷,而实践者则证实了这一点。我只看到过两种反应说“我们已经学过了。”学生们显然学不到CS学者认为他们教的东西。但事实是这样的;如果毕业生在阅读这篇文章时说“这对我来说是新闻”,那么计算机科学学者的做法就错了。

Poul-Henning坎普,斯拉格尔瑟,丹麦

回到顶部

脚注

通信欢迎您的意见。请将您的意见限制在500字以内,并发送到letters@www.eqigeno.com

DOI: http://doi.acm.org/10.1145/1810891.1810893


©2010 acm 0001-0782/10/0900 $10.00

允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,但不得为盈利或商业利益而制作或分发副本,并且副本在第一页上带有本通知和完整的引用。以其他方式复制,重新发布,在服务器上发布或重新分发到列表,需要事先明确的许可和/或费用。

数字图书馆是由计算机协会出版的。版权所有©2010 ACM, Inc.


没有找到条目

Baidu
map