第940章 CUDA决赛（5）（2/2）

张琪琪有些紧张的偷瞄了一眼评委席上的众人，见王卓并不在评委席中，担忧的心情略微有些放松，随即轻咳了两声，开始作答。

“霍夫森林是融合了随机森林分类能力与广义霍夫变换投票机制的目标检测跟踪算法，在2009年被首次提出，核心是通过特征点对目标中心的投票实现目标定位”

“和传统霍夫变换相比，它不需要手动设计目标的解析轮廓，通过机器学习自动学习目标的特征与投票偏移量，天然适配球员这类非刚性、形变严重的目标，抗遮挡能力提升一个量级”

“和传统随机森林相比，它的叶节点不仅输出分类结果，还存储了特征点到目标中心的偏移量与置信度，把分类和目标定位合二为一，一步完成检测与跟踪，无需额外的定位步骤”

李科听到这个回答，嘴角含笑的继续询问了其技术特点。

“这个项目是CUDA编程大赛的参赛项目，请问核心计算流程里，哪些环节必须用CUDA加速？为什么CPU方案做不到？”

“我们的系统有四大核心环节，必须靠CUDA并行加速才能实现直播级实时处理，CPU方案完全无法满足需求”

张琪琪组织好语言再次开始作答。

“第一，视频帧预处理与特征提取环节：1080P视频单帧有207万像素，CPU串行计算HOG（方向梯度直方图）、LBP（局部二值模式）特征需要120s/帧，而CUDA可以把像素级计算分配给上千个线程并行处理，耗时压缩到8s/帧，这是实时性的基础”

“第二，霍夫森林推理与投票环节：这是系统最核心的耗时模块，单帧有上万个特征点需要遍历10棵决策树、完成投票累加，CPU串行处理需要40s/帧，CUDA并行化后仅需2s/帧，速度提升20倍”

“第三，多目标ID关联与轨迹预测环节：全场22名球员的卡尔曼滤波轨迹预测、数据关联，CPU串行处理需要15s/帧，CUDA并行化后仅需0.5s/帧，实现多目标的同步跟踪”

“第四，运动数据实时统计环节：球员跑动距离、速度、热图的实时计算，CPU串行处理需要10s/帧，CUDA并行化后仅需0.3s/帧，不影响主流程的实时性”

“综上所述，CPU方案全流程单帧处理需要185s，最快只能做到5FPS（每秒帧数），完全无法满足直播级30FPS的实时要求，只有CUDA并行加速才能实现真正的实时跟踪”

“足球场景里最常见的就是球员密集遮挡、球衣颜色相近导致的ID切换，你们的系统是怎么解决这个问题的？”

随着回答问题的深入，科大团队的自信心也越来越足了，要知道他们这套系统之所以会被课程表直接引用，主要原因就是他们解决了球场上球员跟踪问题。

何彩娟清了清嗓，她是负责算法优化的。

“针对这两个核心痛点，我们做了三项专属的算法优化，把全场球员的ID跟丢率控制在了3%以内，遮挡30帧内的ID保持率100%”

“第一，多特征融合的霍夫森林模型：我们没有只用传统的HOG轮廓特征，而是融合了球衣颜色直方图特征、号码区域的LBP纹理特征，让模型不仅能识别球员的人形轮廓，还能区分不同球员的球衣、号码，哪怕球员挤在一起，也能通过专属特征区分ID，不会出现ID混淆”

“第二，卡尔曼滤波轨迹预测机制：当球员被完全遮挡时，我们会用卡尔曼滤波基于球员之前的运动轨迹，预测他后续的位置、速度、运动方向，哪怕连续30帧完全看不到球员，也能保持ID不丢失，等球员重新出现时，立刻匹配上原来的ID，不会出现跟丢、ID切换的问题”

“第三，非极大值抑制与轨迹关联优化：我们针对球员密集场景，优化了非极大值抑制算法，不会把相邻的两个球员合并成一个检测框，同时用匈牙利算法做帧间轨迹关联，确保每个球员的ID在整场比赛里全程唯一，哪怕球员全场跑动、频繁交叉，也不会出现ID错乱”

“同时我们还利用了今年《长三角冠军联赛》的决赛视频做了测试，90分钟的比赛里，22名球员的ID全程无错乱，仅在球员完全离场时出现短暂丢失，重新入场后立刻恢复跟踪，完全满足赛事分析的需求”

随着何彩娟的回答解释，现场工作人员立即启动了核验。

他们随即输入了一段半决赛的比赛视频，然后启动了这套跟踪系统，随着大屏幕上密密麻麻显示出各类ID，答辩也进行到了商业化落地的探讨。