中文 英语

权衡在归档数据

在云中存储所有并不是答案。这是一个很多比这更复杂。

受欢迎程度

如果你曾经不得不整理技术文档,想知道仍然有价值,可以安全地扔什么,你能认同托马斯·利维的窘境,加州大学圣地亚哥分校的人类学教授兼联合创始人cyber-archaeology领域。盯着成千上万的陶器碎片在约旦甜点,他错的一切。

“我个人的观点,当我挖掘一个网站是拯救我们身体上收集的一切——甚至所有陶器的碎片,因为我们不知道未来可能会问的问题,”Levy说。”,最终创建一个巨大的物理管理问题。”

半导体行业,数字保存的讽刺是,我们可能无法相信这项技术我们已经创建了。电子产品失败,公司购买或倒闭。此外,存储数据有一个经济组件,无论是测量在内存中,能源成本,房地产,或简单地维护一个数据库,允许数据被访问时是需要的。和存储的数据越多,事情可能出错的可能性就越大。

“现在每个人都云存储,因为它是便宜,但从长远来看,当价格上涨,它变得更昂贵?高级主管”保拉问Jabloner在计算机历史博物馆收藏和档案。“如果一个公司破产或被收购了?作为一个档案,我不会想短期的。我认为50年后。”

出生的新领域
作为一个领域历史考古学家在铁器时代(约公元前1200 - 586),征收面临几个收集的挑战,不仅是现代政治。像许多考古学家本国以外工作,他永远不可能确定一个转折在国际关系中可能会限制访问网站的他的工作。

作为一个解决方案,他和他的同事们开发协议数字存档。“这都是关于创建一个地理空间数据库,我们记录的考古遗迹,历史遗迹,或实际考古发掘过程,”利维解释道。“假设你有一个为期三周的探险。您可以创建3 - 4 tb的数据,所以如果你想存档,这是一个挑战。我们有一个工作流,从物理构件数据到数字数据捕获、数据的管理分析的数据,然后在互联网上的传播数据,在三维可视化平台。”

考古学家研究“物质文化”,它涵盖了从potshards黄金首饰服装纤维纸莎草纸和更多。作为征税数字化材料数据,他意识到数字档案和材料遭受许多相同的问题。他们需要适当的温度控制的环境中,他们的结构完整性可以受到害虫的威胁,火灾、洪水、和盗窃。与数字,还有硬件和软件能否经得住时间的考验,包括维护和迁移。

半导体行业也是如此。维护一个精确的表示一个特定的芯片设计,是否需要替换部分不再工作或用于未来的调试,听起来不像一个大问题。但当有很多复杂的soc在一个特定的汽车,例如,和soc更新或更改每年或每两年,需要保存的数据量是巨大的。

储存:解决方案或问题吗?
即使在短期内,云公司严重限制他们的法律责任,律师理查德Santalesa警告技术。“如果你存储项目,对于你的专利或知识产权是至关重要的,你需要有多个冗余,因为世界上没有云存储提供商可以通过恢复你的损失,”他说。“所有的三大云提供商——亚马逊网络服务,微软Azure,和谷歌的云计算平台——盖他们的损失,通常情况下,1或2 x的费用或在过去12个月。或者如果你有一个非常大的合同,他们将这一组违反或包含超级电容,适用于数据量情况或个人信息的损失。但这些super-caps不适用,如果他们已经失去了的文件与你的数百万美元的专利。”

最重要的是,有一个叫做“spoilation的法律概念。“如果一个公司被起诉,它可以被指责故意“破坏”文件,这使得它更重要的是能够证明为什么一个特定的选择的备份解决方案。

“你需要询问你的存储提供商的实践,”马克·格林伯格说,集团产品营销主管节奏。“当他们退休设备吗?什么时候他们将数据转移到一个新的媒介?有多少份数据会存储?有不同的物理位置数据存储在哪里?”

最后一个问题是至关重要的。当停电在德州2021年2月,出来这么久,备用发电机的燃料用完了。

的价值元数据
在数据存储领域的一个挑战是如何容易的数据是可用的。这一直是个问题,因为早期的主机,当档案数据通常存储站外使用最便宜的技术,在那些日子里是磁带。随着数据量的增加呈指数级增长,需要更快的访问,这种选择不再是可行的。

但是最近的解决方案并不完美。

“这是更难比如果从云存储检索数据服务器上在你的空间,“Jabloner说。“你需要发现的各种元数据来了解你所拥有的。你需要知道它的完整性。你需要能够控制这是谁的手,有检查总结以确保它是原始文件。”

副总裁艾伦•波特、电子和半导体策略西门子数字行业软件,也可回收性的重要性。“你希望能够正确的数据。你需要能够发现数据和校正。如果你的工厂烧毁和数据是坐在植物或服务器上,你不能回来,如何保持你的产品吗?你如何支持客户前进?您还需要一种方法,如果你的公司的业务来源,你可以随意控制数据的权利所以你可以如果你需要推进。”

餐巾和除了
如惠普(hewlett - packard)著名的供奉一个车库,思科致敬餐巾纸。思科的存档Jabloner帮助建立在博物馆,发现复印的餐巾纸工程师柯克Lougheed思科和IBM的雅科夫Rekhter首先拟定边界网关协议(RFC 1105),仍控制着大部分互联网路由。

复制品的餐巾纸现在在许多思科工程师的桌子。但有更多的节省餐巾纸,怀旧。

“这是一个至关重要的标记在当你想出了这个主意,“Santalesa说,警告专利法这么复杂,甚至律师聘请专利专家。普遍的共识是,很快不应该扔掉。“我会坚持,一生实用专利,专利——20年的15年设计专利。你可以在任何地方被起诉。而这仅仅是在美国。有整个世界通过世界知识产权组织的专利制度。然后有版权,他们比专利持续更长时间。”

它不会停止。“有保留协议,由政府实体FCC和FDA和其他人,你必须遵循无论如何,“西门子波特说。“例如,一个审计跟踪,包括可信的可追溯性。喜欢CSI犯罪现场,你必须了解每一块数据是从哪里来的。你需要理解在一个产品的生命周期数据,当它被改变了。现在,考虑到关注可持续性和社会责任工程和开发,你也必须遵循材料通过循环。这可以在原子层面上。如果你有一个产品,包含不同的材料,每个可能都有一个原子的铅,你总在某种程度上,领导是可衡量的和重要的。所以你不仅要遵循这一切,但是你必须能够有效地存储一个审计跟踪的信息。”

优先级和责任可以有所不同,这取决于这个行业。医疗设备或自动车辆尤其如此,这可能是在使用了20年或更多。

保留数据多久取决于谁想要数据,分析与之相关的,他们想做的事情。

”为设计团队,他们现在可能不想看它,”西蒙·兰斯说,负责营销的副总裁Cliosoft。“可能是建筑师想看改善未来建筑设计的性能和低功耗。但是也有不工作的其他方面。软件团队怎么可能做一个无线软件更新来弥补硬件?”

这也意味着可以立即采取可衡量的和有意义的行动。

副总裁Rob柯南特软件和生态系统英飞凌科技,给一个具体的例子这在实时。

“我们部署无线芯片领域,”柯南特说。“在一个案例中我们开始收集数据专门为电池的产品,以及这些设备的能源消耗。我们发现有一个平均水平。但是,20%的设备消耗平均水平的8倍,这意味着如果一个设备应该有sixteen-month电池寿命,20%有一个为期两个月的电池寿命。这导致一群愤怒的顾客。我们分析数据,相关,指出它与什么,最终弄明白发生了什么事。我们当时能够提供软件更新的公司经营这些产品。他们进行无线软件更新,这些异常值的电池寿命增长了两倍。这是之后的事实。后的设备已经发货。 That is what an IoT company does, and I believe that the semiconductor industry is going to do more of that.”

还有重要的操作方面,波特说。“开发人员可能改变代码,无论是硬件或软件设计,在一天之内x乘以的倍数。然后释放到跨职能团队在企业,也许是每隔两到三天,或者一个星期。如果你没有任何类型的存储工作的过程中,你会失去这一天无论如何。你必须回到最后一次这是拱形的企业。如果有人生病或退出公司,你需要继续你的工作过程。你不能对自己说,“我必须回去,找出我们在这个过程中,然后努力前进。你需要知道精确的最后的状态是什么。”

结论
是否包括财富100强公司律师的完整名单,或创业公司只有几个员工,每个人都需要正式的协议在数据保留。如果公司足够大,他们也应该采用一个专门的档案或数据馆员除了法律顾问。和讨论应该超越法律和法规遵从性考虑公司的文化,以及如何庆祝历史可以帮助改善招聘和士气。

说:“你在建筑遗留Jabloner。”一位工程师可能会喜欢他或她在公司工作是第一个做X,即使工程师仍在大学或研究生院。”

尽管最佳实践,公司仍然容易受到数据丢失。“坦率地说,没有什么是永久性的,”波特说。“你必须有冗余。我把在云上的数据,我还是备份4 tb开车。”

参考

  1. Jabloner,宝拉和曼奇尼,安娜(2020)“企业档案在硅谷:建筑和生存在不断变化,“《西方档案:卷11:问题1,第三条。DOI: https://doi.org/10.26077/b786-1c7b,可用在这里


留下一个回复


(注意:这个名字会显示公开)

Baidu