docs(predictV3): 添加predictV3算法优化研究文档和前端功能实现

- 完成Phase 11: predictV3算法优化研究文档,涵盖6个优化方向的技术分析
- 实现置信度评估功能,提供历史命中率、得分分布、多维度一致性置信度指标
- 扩展回测指标体系,新增NDCG@K、MRR、命中率分布等排名质量评估指标
- 优化转移概率算法,引入二阶马尔可夫链和多属性联合转移增强预测准确性
- 设计权重训练机制,支持网格搜索和遗传算法进行数据驱动的参数优化
- 集成组合特征挖掘功能,采用关联规则和序列模式发现号码间潜在关联
- 实现完整的前端交互界面,支持预测结果显示、置信度展示和回测验证功能
- 建立性能优化策略,包括预计算缓存、批量计算和降级策略保障响应速度
This commit is contained in:
2026-05-01 23:17:24 +08:00
parent 02b3ff3a22
commit 8b2590c5b5
26 changed files with 5407 additions and 2 deletions
+5 -1
View File
@@ -844,25 +844,29 @@ foreach ($weights as $key => $value) {
---
## Open Questions
## Open Questions (RESOLVED)
1. **历史数据量是否足够支撑高级优化?**
- 当前默认200期统计,二阶马尔可夫和关联规则挖掘建议500期+
- 需检查数据库中实际可用的历史期数
- 推荐: 查询 `SELECT COUNT(*) FROM fa_history` 确认数据量
- **Resolution:** 11-05 Task 3 设置100期阈值,数据不足时回退一阶马尔可夫,已在plan中处理
2. **权重优化结果如何持久化?**
- 选项A: 存储到 `application/extra/predict.php` 配置文件
- 选项B: 存储到数据库配置表
- 选项C: 每次预测时动态计算(性能成本高)
- **Resolution:** 11-04 采用选项C(动态计算)+ 返回结果给前端展示,不持久化。设计决策:避免过拟合特定时间段,每次获取最新优化结果
3. **置信度阈值如何定义?**
- 当前假设: >=70%为高,50-70%为中,<50%为低
- 需根据实际回测数据调整阈值
- **Resolution:** 11-02 Task 1 明确阈值定义:>=70%高(绿色)、50-70%中(橙色)、<50%低(红色),前端11-03使用相同映射
4. **前端如何展示新增的回测指标(NDCG、MRR)?**
- 需设计用户友好的展示方式
- 可考虑简化为"预测质量评分"单一指标
- **Resolution:** 11-03 Task 2 实现百分比显示 + 柱状图:NDCG@5/MRR以百分比展示,命中分布以柱状图可视化
---