《武汉工程大学学报》  2011年06期 98-101   出版日期:2011-07-30   ISSN:1674-2869   CN:42-1779/TQ
CBR在主板维修中的应用研究


0引言1982年,Roger Schark教授在《Dynamic Memory》中提出基于案例推理(CasedBased Reasoning CBR)技术,并应用该技术开发一个CBR应用系统,该系统是一个简答式的专家系统.它成为尔后许多CBR系统的模型和研究基础.经过三十年的发展,CBR的优点不断挖掘,受到越来越多的学者和企业重视.文献[1]和[2]是将CBR与其它方法进行结合研究;而文献[3]~[5]则是对案例库的本身维护及应用进行研究,总的说来其应用领域有:企业决策,问题求解,系统故障诊断,天气预报等方面.而主板维修是主板制造企业在生产过程和售后服务中的一个必不可少的环节,对不良品的处理是不少此类企业必须解决的问题,因此,将CBR技术与原理应用到主板维修中探讨和研究,以从理论模型上寻求解决问题的可能性.1CBR的基本原理受到人类认识事物过程中的推理记忆启发,CBR被提出.CBR系统可看成对过去类似问题的回忆,与现有的问题作比较,给出解决现有问题的方案,也就是一种应用之前类似的求解策略来解决当前问题.它实质是用领域中现有的经验通过推理来解决问题.一般来说,CBR的原理图如图1所示,它包括两个方面:即经验重用和经验自学习[6].经验的重用是指对实例库中有相同或相似的例子作为参考来解决问题;经验的自学习指的是当案例库中没有满足的实例时,通过适当的修改,修改后的案例可以解决问题,将修改后的案例存入案例库,作为下次使用的参考.CBR推理如下[7]:(1)检索(Retrieve)从案例库中搜索相似案例.(2)重用(Reuse)复用相似案例并求解当前问题的解决方法.(3)修改(Revise)修改解决方法以适应解决当前问题的案例.(4)保存(Retain)保存新案例以作备用.图1CBR原理图
Fig.1Principle Scheme of CBR从原理图中可知,案例检索(Retrieve)是十分关键的一步.需要计算案例库中的案例与问题案例的相似程度,从而获取待解决问题的相似案例.它的主要任务是检索案例库,计算案例库中案例与问题案例的匹配程度,从而获得新问题的相似案例.案例重用(Reuse) [7]就是在获取的案例中重用相似案例的解答来解决问题.简单的说,案例重用分为复制和调整两部分.前者,指的是拷贝(Copy)重用案例的解决方案.后者,指的是用户对过去案例对象的信息进行分析,来判断它与问题案例之间的不同,适当的调整(Adapt)以进行重用过去案例的适用部分.  案例修改(Revise) [7]是指对案例检索得到的相似案例的解决方案进行修改以解决新问题的过程.案例修改通常包括方案评价和修正两个方面,它涉及到复杂的领域知识,评价和修正一般需要人为的进行干预,由人机交互产生结果.案例保存(Retain) [7]是为将来解决问题保留可能有用的经验部分.2主板维修在主板生产过程中(主板生产流程如图2所示),因料件,制程,周转,人为等原因可能造成主板的不良.故而,不良品维修在生产中是一个不可回避的环节.而维修的成本除设备,料件是可预知的,其人力成本是波动的,同时对交货期限也带来一定影响.维修经验可否复用和推广是管理者思考的问题.首先了解一般主板工作的基本条件:(1)电压供电正常,(2)接地信号良好,(3)时钟频率信号准确,(4)主要数据信号,控制信号正常,(5)Reset信号正常.如上述条件满足,则主板能正常开机,但可能有其它功能性不良,如:打印机接口功能失效,USB接口功能失效等.其次,受工作时间,个人认知和学习水平的限制,维修经验是一个模糊的概念.图2主板生产流程图
Fig.2Flow diagram of Motherboard production企业为使成本变得更可控,交货期限符合合同要求,ICT(in circuit test,线路板内路测试)测试应运而生,但其高昂的价格和需要专人维护,增加了企业的生产成本.假若产品的订单量可观,其产品成本增加是微量的(例如:500万片的订单增加的设备和人工成本为1 000万元,则单个产品的价格上升2元/片,成本价格上涨是可接受的),但随着产品多样性和客制化程度的深入,更多的企业选择人工维修.第6期伍儒彬,等:CBR在主板维修中的应用研究
武汉工程大学学报第33卷
3CBR在主板维修中的应用实例主板维修的最终结果有两种.一种是找出原因维修成良品;另一种是无法找出不良原因,申请报废(两个特例:PCB断线,氧化亦属于此列.)为便于研究,约定:将每一块不良主板都作为一个案例分析,同时人为误判(测试人员将良品判定为不良)不作研究.在基于框架表示的案例推理中,框架表述应清晰,简洁,其难点是所建立的框架怎样才能全面表述案例.一般来说,主板维修的案例表示有以下内容:(1)案例的基本信息,(2)案例的特征,(3)案例的解决方法和结果.主板维修过程中,有一种不良现象为:不开机.按维修的一般流程如图,以不开机现象为例,用框架表示法表达知识,并进行推理.由前述的主板工作条件可知,可能造成主板不开机的原因如下:(1)供电电压不正常,(2)接地信号不良,(3)时钟频率信号错误,(4)主要数据信号,控制信号不正常,(5)Reset信号不正常.依据维修的特点,采用框架知识表示方法表达如下:
框架名:不开机(代码001)主板ID号:W1232456789主板架构:Intel 845系列主板所属机种:A机种主要电压:查询电压判断子框架进行处理,(结果为正常或不正常)复位信号:查询复位信号判断子框架进行处理,(结果为正常或不正常)时钟频率信号:查询时钟信号判断子框架进行处理,(结果为正常或不正常)接地信号:查询接地信号判断子框架进行处理,(结果为正常或不正常)数据信号:查询数据信号判断子框架进行处理,(结果为正常或不正常)维修时间:2010年12月20日×时×分维修工程师ID号:Y0012维修处理结果:由子框架返回一个结果或多个结果该框架中,主板ID号,主板架构,主板所属机种,维修时间,维修工程师ID号的信息均由企业的SFIS(ShopFloor Information System 现场信息整合系统)系统导入.由于造成不开机的原因众多,因此分成多个子系统来完成该框架的描述,每个子系统检测某一方面的特性并给出处理办法和结果.以下列出三个子框架,电压判断子框架,复位信号判断子框架,时钟频率信号判断子框架来作分析:
框架名:电压判断处理主板ID号:W1232456789主板架构:Intel 845系列电压Vcore: 电压范围值,典型电路电压Vcc 1.5 V:电压范围值,典型电路电压Vcc 2.5 V:电压范围值,典型电路电压Vcc 1.8 V:电压范围值,典型电路电压Vcc 3.3 V:电压范围值,典型电路
。。。。。。 。。。。。。判断与处理结果:某电压值不正常,更换电子元件
(如MOS管)后正常或所有电压值正常
(结果返回到上一级调用框架) 在电压判断子框架中,主要判断各类电压的供给是否正常.图3是Vcore电压供电电路,用示波器检测Vcore电压,测量A,B两点的电压值,其中Vcore的值应处在A点与B点的值之间,若A、B两点的值为零或过高,则CPU不能正常工作,首先确定A与B两点对应的场效应管工作是否正常,再确定HIP芯片是否工作正常,最后再判断ISL芯片是否工作正常.若判定某一芯片工作不正常,应取下,再判断是否对其它的连接芯片或电子元件造成损坏.若图3中HIP损坏有可能造成A点的场效应管损坏.图3Vcore电压供电电路
Fig.3Circuit of Vcore’s Power Supply 图4是将Vcc3电压转为Vcc1.5,用以提供Vcc1.5电压,电路中只用到一个电子元件,判断过程与外部联系不大,只需要确定Vcc3电压正常,此时Vcc1.5不正常,则考虑图中电压转换元件是否损坏.图4中Vout的计算公式为
Vout=1.25*(1+R2/R1)+50 μA*R2
图4Vcc3电压转Vcc1.5电路
Fig.4Circuit of Vcc3 to Vcc1.5 框架名:复位信号判断处理主板ID号:W1232456789主板架构:Intel 845系列复位信号1:PCI复位信号,典型电路复位信号2:ISA复位信号,典型电路复位信号3:南桥复位信号,典型电路
。。。。。。 。。。。。。判断与处理结果:某复位信号不正常,更换电子元件
(如南桥)后正常或所有复位信号正常
(结果返回到上一级调用框架)在复位信号判断子框架中,主要判断两方面:是否有复位信号和有复位信号时信号正常与否,找到PCI槽位的第11 PIN进行确认,而ISA复位信号则是在ISA槽位第2 PIN进行确认,而南桥的复位信号一般都有延伸出来,如图5所示,只要在对应的芯片连接上找到该PIN脚,在开机时进行检测.
图5复位信号逻辑示意图
Fig.5Logical indication of Reset Clock框架名:时钟频率信号判断处理主板ID号:W1232456789主板架构:Intel 845系列时钟频率信号1:14.318M,典型电路时钟频率信号2:PCICLK33M,典型电路时钟频率信号3:USBCLK48M,典型电路
。。。。。。 。。。。。。判断与处理结果:某复位信号不正常,更换电子元件
(如晶振)后正常或所有复位信号正常
(结果返回到上一级调用框架)在时钟频率信号判断处理子框架中,主要用来判断各类时钟频率信号是否正常.如图6所示的电路,首先确认晶振Y是否工作正常(一般为14.318 MHz,具体以实际电路为参照),再来判断各种时钟频率信号是否正常,最后延伸到各终端电路.在图6所示的电路中,若CLK信号不正常或未提供时钟频率信号,而晶振Y,接地和电压工作正常,就可判定为ICS芯片不良.图6时钟频率信号电路
Fig.6Circuit of Clock Frequency现假若某片主板不开机送至维修站,维修工程师按一般流程进行检测,确定原因所在.当其基本工作电压正常,而某一个时钟信号(假设14318)不正常,利用设备进行检测,确认为PCB断线,则进入“主板报废审批”(参考主板报废审批框架).(或确认为提供14.318频率的晶振不良,更换料件后再进行维修判断,返回到不开机框架里至少有一条14.318时钟信号不良,更换晶振后时钟信号正常)
框架名:主板报废审批主板ID号:W1232456789主板架构:Intel 845系列主板所属机种:A机种申请报废时间:2010年12月20日×时×分申请报废工程师ID号:Y0012申请报废原因:无法维修或PCB断线,氧化审批处理结果:同意(产品转报废库)
不同意(产品转不良品待分析库)
(结果返回到调用框架)4结语将CBR引用到主板维修中是一种探讨和尝试,基于CBR的知识学习模式是增量,不断扩大的,特别是造成主板不良现象的原因有多种.一方面,能不断的积累经验和知识,对后续的案例提供解决方法和思维模式,为新手的培训提供了平台和帮助,并有利于维修工程师提高工作效率;另一方面,若无限制的将所有案例都保存,必将增加新案例寻求解决方案时的检索成本,同时运行效率下降.又因为主板维修的记录必须全面保存下来,以便于以后的品质追踪,所以如何全面的保留解决方案且具有较高的运行效率有待深究,这将是下一个阶段的研究方向和重点.