题开始。
第二题:基于社交媒体数据的突发事件检测与预警系统。
给定推特风格的数据流,设计算法实时检测异常话题,评估潜在风险,提供预警建议。
“这是自然语言处理加异常检测,”白彦秋快速分析,“需要文本预处理、特征提取、聚类分析,还要考虑时间维度。”
“而且数据量很大,”江蓓儿看着题目附带的示例数据,“实时处理需要高效的算法设计。”
两人对视一眼,都看到了挑战,也看到了兴奋。
这道题比第一题难得多,但也更有意思。
“分三步,”江蓓儿在白板上写下框架,“第一,数据流预处理和基础特征提取;第二,在线聚类和异常检测;第三,风险评估和预警生成。”
这章没有结束,请点击下一页继续阅读!