人工智能与数据在模具制造中的应用

〈 笔者 : 原 武史 〉
Takeshi Hara:岐阜大学 教授

2012年,深度学习作为人工智能技术的核心迅速传播开来,成为一个备受关注的新研究领域。当时,一种利用人工神经网络(ANN)进行图像分类的方法在一场竞赛中脱颖而出。10多年过去了,人工智能技术已经渗透到许多产品中。从上世纪70年代开始,人工神经网络和机器学习(ML)一直在统计学和工程学领域进行研究,并且已被证明是实用技术。同时,这些技术也得到了广泛的数学理论支持。随着计算机性能的不断提升,高性能计算机变得更加便宜,这意味着即使在小型设备如智能手机和可穿戴设备上,也能实现高度并行计算,从而使得与人工智能相关的计算可以在实际时间内进行处理。现在,人工神经网络和机器学习已经被广泛应用于解决许多问题。

在人工智能技术的浪潮中,2023年出现的ChatGPT(Chat Generative Pre-trained Transformer)引起了广泛关注,为社会带来了重大变革。

在ChatGPT出现之前,大部分人工智能技术都需要专门的输入和输出接口,以便将数据输入到人工智能系统中并获得结果。ChatGPT则以其独特的自然语言输入和输出功能而备受瞩目,用户可以通过与其进行对话式交互来实现各种请求 。这意味着您可以输入文本并要求ChatGPT对其进行总结,或者输入图像并以语言形式表达其内容。可以说,这是人工智能试图模仿人类语言能力的一大尝试。

在图像识别领域,人工智能的能力也发生了重大变化。计算机视觉(CV)技术是一项尝试使计算机理解图像的领域,涵盖了手写字符识别、面部图像识别、物体识别与计数、场景理解、产品检测以及视觉检测等生产目的。这些技术的发展奠定了与技术相关的基础。一些CV技术正在被深度学习技术所取代。

在CV技术中,一个关键问题是确定图像中对象的区域。Meta(前身为Facebook)对人工智能技术的发展做出了重大贡献,其推出的Segment Anything Model(SAM)可以说超越了以往的CV相关技术。图1展示了SAM的执行示例,其中图像中 “猫” 的区域被标记为颜色(紫色)。这一示例展示了结果,即通过鼠标在图像上的指示,SAM自动划分了Boyd所指示的区域。对于人类来说,提取目标区域在这种图像中通常是一项简单的任务,但在CV领域却被认为是一个复杂的问题。然而,SAM被认为利用了互联网上大量的图像数据和人工计算,从而创建了正确的数据,并建立了区域分割模型。换句话说,SAM通过将 CV技术的核心任务分解为多个子任务,并对其进行综合来实现其目标。这一进展使得自然语言识别和图像识别领域从研究到实际应用都取得了长足的进步。

在这篇文章中,我们从图像工程以及其在人工智能领域的应用角度来探讨了这种快速变化的人工智能技术如何为未来的制造领域做出贡献。

自然语言处理技术可用于计算单词和句子的相似度,从海量数据中检测相似的表达和文档。许多方法通过将
单词或句子转换为多维向量来实现这一目标。图2展示了使用n-gram(当n=2时)对两个句子进行向量化的示例,这是最基本的句子向量化方法。在这个示例中,“我妈妈牙齿不好” 和 “我妈妈心情不好” 这两个句子被分别表示为向量A和向量B。使用n-gram的向量化方法非常简单,它从头开始机械地提取两个字符(当n=2时)并将其用作索引,然后统计索引出现的频率,结果就是句子的向量。如果采用这种向量化方法,那么向量的相似度被认为与句子的相似度成正比。为了评估相似性,通常使用欧几里德距离或两个向量之间的余弦角。在这个示例中,提取的两个字母是语言处理的单位,通常被称为标记。

在制造业中,自动分类指令和图纸被视为一项有价值的任务。如果能够自动评估指令和附图的相似度,则可以
根据给定的指令自动检测相似的指令和附图。

图3展示了构建这类系统所需的流程。首先,所有书面文本必须被数字化并进行收集。作为数据清理的一部分,不准确的表达和不完整的术语将被删除和纠正。在某些情况下,术语和语言用法的词汇表会被预先创建
为语料库。说明书和设计图纸通常包含有关术语使用的规则。仔细的清理工作将大大减少将具有相同含义的单
词翻译成不同向量的错误。

接下来,如上所述,选择文本向量化方法和相似度计算方法。搜索引擎现已完成,您可以选择搜索算法。例
如,确定搜索规则的方法,例如按照相似度降序选择10个示例,也可以交由本站负责。结果,相似的指令被提取出来,并对结果进行评估以查看它们是否符合目的。评估可以由个人主观地进行,或者在搜索结果复杂的情况下,可以由由多个专家组成的小组进行评估。之后,提供用户界面以使其更易于使用。

制造设备具有各种随时间变化的特性,比如旋转操作。因此,故障预测和异常检测成为了重要的目标。在制造和模具相关的设备中使用人工智能时,面临的典型问题包括与制造过程直接相关的设备故障预测、故障分类和异常检测。在制造业中,设备的故障率和事故率通常很低,因此大多数情况下不能简单地应用基于正确数据的分类和异常检测方法。这是因为许多基于人工智能的分类和检测方法通常是在学习正常和异常状态的基础上运作的,能够在存在差异时正确分类或检测。这种方法被称为监督学习。然而,当要处理的数据极度不平衡时,
比如异常发生率与正常发生率相比非常小时,这种方法就不再适用了。

举例来说,如果异常的发生率为0.01%,那么即使不做任何学习,假设一切都正常,分类性能也会达到100%。因此,针对这种不平衡数据,通常会采用异常检测技术来处理。图4展示了一个流程,通过机器配备的转速、压力和电流三个传感器的时间序列信号来确定异常。机器的状态,例如转速,是由传感器检测的,传感器的模拟信号会经过数字转换以转换为可计算的形式。无监督学习是基于仅在正常操作期间收集数据并定义一系列正常值的方法。收集的数据通常包括不稳定的情况,例如传感器被移除或设备开始运行时,因此必须对这些数据进行清理和删除。如果有多个传感器,就需要确定使用哪个传感器的信号。必要时,需要对值进行归一化和标准化。如果能够收集足够数量的正常数据并将其放置在特征空间中,那么正态数据将存在于某种有限的范围内。这是因为在正常情况下,所有传感器的值都会在同一范围内振荡或保持恒定。换句话说,正常特征的状态可以在某个区域内表达,如图5中紫色范围所示。如果确定了这样一个特征空间,并且可以根据正常数据确定其内的正常范围,那么当给定未知数据时,可以根据该数据和正常数据的中心点C和半径r来实现异常检测。
这里的特征空间被表示为由多个传感器组成的多维空间。因此,使用各种降维方法进行可视化。

图像生成人工智能和文本生成人工智能技术具有潜力在制造业中自动生成图纸和程序手册,就像生成式人工智能创建计算机程序一样。三维CAD,即制造业的绘图工具,是一种用于绘制几何结构的计算机程序。因此,通过自然语言表达绘图内容,可以轻松实现绘图的自动生成。通过这种方法,有可能探索新的图纸管理方法,比
如新的图纸创作方法、教育以及图纸转换等。然而,由于这些技术是基于学习生成的,如果存在知识产权问题,比如使用过去的学习数据,或者学习数据存在偏差,那么生成的结果可能会有所偏差。工作程序和修复方法被认为是生成人工智能的专业领域。在互联网上已经存在PDF或其他格式的恢复手册,ChatGPT具有很高的解决问题能力,因为它已经了解了该过程。然而,需要小心谨慎,因为训练时使用非公开信息可能会导致信息泄露,尽管目前最受关注的方法是使用大规模目标语言模型,并通过添加数据进行学习。

人工智能在问题解决模型中的运用,实际上可以通过简单的统计处理来实现,而且某些问题已经在运筹学
(OR)领域找到了解决方案。运筹学致力于科学地概括各种决策问题,并找出最佳解决方案。尽管很多优化请
求已在现场出现,但已有很多解决方法在运筹学领域得到了分类。然而,即使解决方案明确,也可能需要大量
计算才能找到最优解。近年来,量子计算备受关注,有望在极短时间内解决以往无法获得的最优解。特别是,
量子计算算法已经展示了对旅行商问题和装箱问题的解决方案,因此人们对其期望很高。在制造业中,人工智能和数据的应用方面,谈到了自然语言处理、异常检测、生成式 AI等可能性,以及如何将其与运筹学领域相结合。到目前为止,人工智能在制造业的应用主要集中在减少停机时间、提高维护效率等方面,如通过故障预测和修复等。这些挑战已通过特征分类任务和异常检测来实现。未来,通过对大规模语言模型的额外学习,并同时保留机器数据并专门针对公司内容的模型,将在商业中发挥作用。这将导致质量控制和维修指令的自动化,以及利用历史数据的数据驱动的制造和生产管理。具体来说,我们将建设一条完全自动化的生产线,实现小
批量、多品种生产,以满足详细的客户要求,管理库存,优化能源、制造和交付流程以及维修方法。只有人们信任人工智能,这些事情才能实现。因此,有关人工智能系统安全和伦理问题的立法不容忽视。