中文 英语

数据管理的发展

设计周期中的巨大增长需要新的技术来管理数据。

受欢迎程度

Semiconductor Engineering坐下来与Jerome Toublanc讨论数据管理的挑战有限元分析软件;Kam Kittrell是Digital & Signoff集团的产品管理副总裁节奏;西蒙·兰斯,营销副总裁Cliosoft;Rob Conant,微软软件和生态系统副总裁英飞凌科技;以及技术解决方案销售高级总监迈克尔•蒙西西门子EDA

上图,从左到右:Jerome Toublanc,有限元分析软件;锦Kittrell,节奏;西蒙•兰斯Cliosoft;罗伯•科南特英飞凌科技;以及迈克尔·蒙西,西门子EDA

SE:行业在数据管理方面的立场如何?我们将走向何方?

时:这是我们关心的一切。当你完成芯片封装系统的设计流程时,我们需要大量的数据,我们生成了大量的数据。我们的客户愿意确保这是正确的做法,以保证产品的成功。

Kittrell:从SystemC到RTL,从RTL到地点和路线,以及现在正在兴起的3D-IC,主要是一条数据的装配线。这一切都是从概念到用积木来建造东西。在此流上下文中,数据管理的概念非常重要,因为每个客户都构建了自己的流,并在此基础上进行定制,以处理自己独特的、特定的数据需求。我们在开发过程中添加了一些实用程序,帮助人们在构建芯片时比较不同的运行,我们看到随着我们的发展,这一功能将迅速扩展。

Munsey:我已经在数据管理领域工作了10年或12年,我见证了它从非常特定于工具或特定于应用程序的小块数据发展起来。它已经发展到非常笨重的地步。元数据需要被视为产品的一部分,这需要从产品生命周期的角度进行。因此,随着产品和流程的开发,数据需要更好地结构化,并更好地与产品开发流程联系起来。你需要能够分析所有这些数据,对过去发生的事情做出明智的决定,以及你在未来需要做什么,因为它映射到设计的实现方式。

兰斯:我们有帮助管理设计和IP数据的产品。我们已经看到了数据管理和IP管理的巨大增长,以及IP和设计重用的增加。越来越多的数据需要管理,或者必须找到。根据公司的规模,这些数据可能来自一个大陆,也可能来自不同的大陆。您可能不知道所有的设计数据在哪里,因此需要设计数据管理系统和改进的协作。如何重用这些设计?你是否知道这些数据的质量,以便你可以将其应用于未来的设计?这就是我们现在在数据管理领域看到的转变。

柯南特:在另一个层面上,我加入英飞凌是因为收购了我创办的一家公司,该公司为互联产品提供产品分析。我们正在做的是汇总和收集关于我们的半导体产品在客户流程中的表现的数据。我敢打赌,你们每个人都有使用英飞凌WiFi芯片数据收集功能的消费电子产品。我们正在从每天数亿个数据点的现场数据中改进我们的半导体产品和这些产品中的软件。这是一个巨大的数据问题。这也是一个巨大的AI/ML机会,可以提高这些产品在该领域的性能。有些人已经研究WiFi 20年了,我们在数据中发现了一些让他们大吃一惊的东西。他们从来不知道这些情况在实地存在。他们的算法和半导体在这个领域的工作方式与他们预期的非常不同,我们只是通过汇总和收集数据才发现这一点。

SE:当涉及到数据管理时,从地缘政治的角度来看,全球设计团队需要关注什么?如何正确地共享数据?谁能看见它?谁不能?如何实施这些保护措施?

Munsey:这有多个层面,因为你可以访问数据,但如果你去世界的另一个地区,情况就不同了。仅仅因为你在美国可以访问,你不可能在任何地方都可以访问。很多IP泄露和数据泄露都是在不经意间发生的,当有人带着笔记本电脑去中国时,在他们的网络上打开它,然后从技术上讲,数据在发生的那一刻就被导出了。必须有类似地理围栏这样的保护系统。世界上有一些特定的地区,你可以根据这些地区来屏蔽东西。然后,根据你所在的国家有不同程度的限制,每个国家都有一定的数据访问权限。你可以设置护栏来防止一些泄漏,但你不能阻止他们一起工作。你仍然需要允许工程师合作的方法。我们的目标是建立一个具有设计表示的工作空间,其中对于我不能看到或不应该看到的数据,因为我在某个区域,它会被黑盒化。所以我仍然可以做我需要做的工作,这取决于我在世界上的任何地方,或者我在特定时间与谁合作。 These different layers must be established at the country level, the person level, and then internal classifications as well, to be able to build systems that allow for collaborations to still happen while you protect the data.

兰斯:除此之外,它不仅仅是管理数据。它的管理和规则适用于相当细的粒度。很多问题都是偶然发生的。国防部已经建立了出口控制,以确保这些系统将防止数据泄漏,标记它,并让人们意识到它。有时这样做是出于恶意,但通常不是。

Kittrell:EDA公司投入了大量的精力来保护数据——我们的数据,我们客户的数据。有几种协议,特别是当他们从客户那里获得IP时。很多时候,我们在使用这些工具时遇到了问题,因为它们必须与我们共享数据。它可以进入某些地区,但只能被特定的人看到。我们必须列举他们是谁,我们必须仔细考虑所有这些事情。即使是我们自己的员工,你也不想把所有数据都暴露给所有人,因为这太危险了。在很多方面都有太多的过渡。因此,人们必须认真思考,并经常重新审视人们需要分享哪些数据。有趣的是,无论何时我们进入云计算领域,我们都在对云计算进行测试。一些从云中的IP扩展中受益最大的IP提供商在让他们的IP进入云进行测试等方面受到了最严格的限制,这是可以理解的。 It’s better to be cautious, because once it’s out it’s gone.

SE:你现在看到了多少数据,这些数据是如何管理的?

时:这是个很难回答的问题。这个数字很难量化。这取决于产品的类型。但是体积膨胀很快。这是我们在过去几年里看到的一个趋势,这对客户来说是一个真正的挑战,因为他们必须存储数据。他们必须以一种安全的方式这样做,以确保一切都在控制之中。随着人们继续转向云计算,他们为更多模拟或场景打开了大门,但这样做会扩大同一类型产品的数据量。最重要的是,人们现在加入了机器学习,当你有数据的时候,这是很棒的,因为这是机器学习背后的想法。您需要大量的数据,而业务正在生成额外的数据。从芯片的角度来看,我们过去没有非常相似的项目的大量数据。 If you take a project that’s very similar to another two years earlier, the amount of data is very big because there’s a big increased in bandwidth.

Munsey:一些客户在项目结束时告诉我,拥有pb级的数据并不罕见。这又回到了你如何管理它,因为很多数据是非结构化的。那么什么是重要的,你可以用它做什么?如果你以后确实想要挖掘它并寻找历史趋势,那么很难预测哪些需要保留,哪些不需要保留。越来越多的人开始使用数据模型来定义重要的度量标准。如果您可以定义正确的度量标准,那么您就可以设置系统,从报告文件、日志文件、其他工具运行和其他所有东西中抓取数据,然后开始在结构化环境中填充数据(即使数据是非结构化的),并保留重要的内容用于趋势分析和类似的事情。

兰斯:数据量确实在呈指数级增长。例如,我们在汽车等垂直行业看到了这一点,传感器数据与现场数据一起实时返回。大量数据正在被实时分析。其中一些数据只是被存储起来,以便日后进行评估,比如性能改进或设计改进。我不认为任何人有正确的解决方案,如何量化或描述数据,“我们肯定需要存储这个和保存那个。”或者,我们需要在这段时间内保存这些数据以进行某种分析,某种分析。“这是下一件事。你如何量化它?你如何界定它?你如何利用它?当你最终说,‘好吧,现在我们可以释放它了,因为我们不能一直存储下去?”

柯南特:我同意数据量呈指数级增长。我们为很多不同的物联网公司服务,当公司开始这个过程时,他们要做的第一件事就是为客户提供一些价值。但很快,问题就变成了可以从这些产品中收集到什么样的数据,并提高这些产品在该领域的性能。一旦你达到了这一点,那么公司就是数据的消费者。有很多用例都是假设的,或者可能还没有很好地定义,所以人们想要囤积这些数据。因此,你最终会得到大量的数据。你保管多长时间?九十天?十年?真的很难决定。 The data models evolve pretty quickly. That means the older data becomes stale over time. But we’re seeing that grow quite a bit. I’ve been in this IoT space for a long time, and maybe ‘IoT’ is not even the right or meaningful word anymore. It’s really about things that are connected to the internet, which includes almost everything that’s electronic — unless it’s air-gapped military equipment. If you look at the electricity meter in a home, the smart grid space, utilities are collecting gobs and gobs of data today. Infineon provides a tremendous amount of power electronics into all sorts of different kinds of applications. When we think about data from the grid, the data from wind farms, a lot of that relates back to the power components that are inside those products, which becomes a semiconductor problem. It’s an opportunity for semiconductor companies to improve the performance of those products in real-world environments in ways that are really defensible and hard to copy. It’s a really strong, competitive differentiator if you want to have access to that data, and to be able to use it to inform the product development process.

SE:那么来自特定工具的特定设计数据呢?如果从每次运行中都有学习,这是否意味着我们可以把已经处理过的数据留在后面?

Kittrell:对于设计实施,我们看到了两个巨大增长的向量。一个是,仅仅是创建一个5纳米,10亿或20亿实例芯片,你将至少有一万亿个矩形,因为所有的逻辑都必须存储在那里。您将运行这些实例的多个实例化。你得到的不仅仅是最终产品。这是一个假设,任何时候我们给工程师磁盘空间,他们将在48小时内耗尽它。所以他们必须管理重要的事情,他们有一些方法来做到这一点。机器学习的另一个方面是帮助客户进行设计。这需要一个工程师,通常如果他们要做很多工作,他们不会一次只做一次。他们一次跑三到四次。通常情况下,在你开始犯一堆错误之前,你只能一次在脑海中记住三到四个实验。 The machine could do 10 at a time, but now you’re generating a lot more data. You’re having to organize that data to get some sort of feedback. This is all built into our AI platform. Where we’re taking that next is, ‘Instead of doing three or four blocks, how do you do it as a sub-system?’ Usually there’s a team that does a GPU sub-system. How do I map that to one engineer? So there’s more and more data, and it’s exploding in two different directions for us. Then it comes back to how to categorize the data? How do I manage it? What is the important information, because there’s lots of unimportant information?

Munsey:这也是与环境相关的。将会有特定于该设计的数据,在它实现的方式中,在特定的工艺技术中。你可能想把它存档,但在那个设计中有IP会在其他设计中被重复使用。可能存在仍然有效的功能验证信息,您希望能够重用该信息。同样,您需要了解哪些是特定于ip的、可以重用的,哪些是特定于实现的、只需要存档的。

Kittrell:我们要做的一件事就是优化能量。我们需要有有趣的电力场景来优化。否则,我们会造成损害。实际上,我们会为了我们关心的事情而伤害权力。验证人员和实现人员通常不怎么交流。验证人员必须为这个特定版本的RTL生成,这个功率向量,这对于实现来说很有趣。然后他们必须以某种方式进行沟通。



留下回复


(注:此名称将公开显示)

Baidu